ベルマン最適方程式
べるまんさいてきほうていしき
累積報酬を最大化する最適な方策(行動戦略)のもと,価値関数と報酬の関係を記述する方程式である.一般的には,環境と報酬が既知の状況で,ベルマン最適方程式から最適方策を求めることができる.(実験医学増刊3820より)
機械学習を生命科学に使う!
シークエンスや画像データをどう解析し、新たな生物学的発見につなげるか?
解説は発行当時の掲載内容に基づくものです
本コンテンツは,2018年まで更新されていた同名コンテンツを元に,新規追加・再編集したものです