メインメニューを開く

差分

Q学習

32 バイト追加, 2017年3月29日 (水) 02:07
編集の要約なし
Q学習は古典的な機械学習手法である。
小難しい説明が多いようだが、大雑把にいえば、Q学習で[[ググる]]と小難しい説明が多いようだが、大雑把にいえば、関数qは、ある状況sにおいて、行動aを選択した場合の結果を得点を返す。関数qは、ある状況sにおいて、行動aを選択した場合の結果を得点として返す。
このQ(s,a)関数の行動aを変えまくって最高得点が出るパターンを力技で見つけるというものである。
Q(s, a)
匿名利用者