「Q学習」の版間の差分
編集の要約なし |
|||
| (同じ利用者による、間の1版が非表示) | |||
| 5行目: | 5行目: | ||
Q学習で[[ググる]]と小難しい説明が多いようだが、大雑把にいえば、 | Q学習で[[ググる]]と小難しい説明が多いようだが、大雑把にいえば、 | ||
関数qは、ある状況sにおいて、行動aを選択した場合の結果を得点(報酬)として返す。 | |||
このQ(s,a)関数の行動aを変えまくって最高得点が出るパターンを力技で見つけるというものである。 | このQ(s,a)関数の行動aを変えまくって最高得点が出るパターンを力技で見つけるというものである。 | ||
「力こそパワー」である。 | |||
Q(s, a) | Q(s, a) | ||
| 24行目: | 25行目: | ||
[[category: 機械学習]] | [[category: 機械学習]] | ||
[[category: 人工知能]] | |||