「Q学習」の版間の差分

編集の要約なし
 
(同じ利用者による、間の1版が非表示)
5行目: 5行目:


Q学習で[[ググる]]と小難しい説明が多いようだが、大雑把にいえば、
Q学習で[[ググる]]と小難しい説明が多いようだが、大雑把にいえば、
関数qは、ある状況sにおいて、行動aを選択した場合の結果を得点として返す。
関数qは、ある状況sにおいて、行動aを選択した場合の結果を得点(報酬)として返す。
このQ(s,a)関数の行動aを変えまくって最高得点が出るパターンを力技で見つけるというものである。
このQ(s,a)関数の行動aを変えまくって最高得点が出るパターンを力技で見つけるというものである。
「力こそパワー」である。
  Q(s, a)
  Q(s, a)


24行目: 25行目:


[[category: 機械学習]]
[[category: 機械学習]]
[[category: 人工知能]]