ベルマン最適方程式

べるまんさいてきほうていしき

累積報酬を最大化する最適な方策（行動戦略）のもと，価値関数と報酬の関係を記述する方程式である．一般的には，環境と報酬が既知の状況で，ベルマン最適方程式から最適方策を求めることができる．（実験医学増刊3820より）

機械学習を生命科学に使う！

シークエンスや画像データをどう解析し、新たな生物学的発見につなげるか？

小林徹也，杉村　薫，舟橋　啓／編

解説は発行当時の掲載内容に基づくものです

本コンテンツは，2018年まで更新されていた同名コンテンツを元に，新規追加・再編集したものです

関連書籍