「Q学習」を編集中
ナビゲーションに移動
検索に移動
この編集を取り消せます。 下記の差分を確認して、本当に取り消していいか検証してください。よろしければ変更を保存して取り消しを完了してください。
最新版 | 編集中の文章 | ||
5行目: | 5行目: | ||
Q学習で[[ググる]]と小難しい説明が多いようだが、大雑把にいえば、 | Q学習で[[ググる]]と小難しい説明が多いようだが、大雑把にいえば、 | ||
− | + | 関数qは、ある状況sにおいて、行動aを選択した場合の結果を得点として返す。 | |
このQ(s,a)関数の行動aを変えまくって最高得点が出るパターンを力技で見つけるというものである。 | このQ(s,a)関数の行動aを変えまくって最高得点が出るパターンを力技で見つけるというものである。 | ||
− | |||
Q(s, a) | Q(s, a) | ||
13行目: | 12行目: | ||
勉強に近道はないということだな。 | 勉強に近道はないということだな。 | ||
− | + | 2015年2月26日にグーグルが、 | |
− | 古典的なQ学習を、流行りの[[ディープラーニング]]に喰わせた「[[DQN (Deep Q Network)]]」という画期的な人工知能を発表し、とくに日本で話題となった<ref>[ | + | 古典的なQ学習を、流行りの[[ディープラーニング]]に喰わせた「[[DQN (Deep Q Network)]]」という画期的な人工知能を発表し、とくに日本で話題となった<ref name="yahoo">[http://headlines.yahoo.co.jp/hl?a=20150226-00000001-withnews-sci Yahoo!ニュース グーグル開発の人工知能、その名も「DQN」ネットでは「命名事故?」「奇跡的」]</ref>。なお、[[DQN]]の実装例としては[[Google]]の[[AlphaGo]]が有名であり、かなり賢い模様である。 |
== 関連項目 == | == 関連項目 == | ||
25行目: | 24行目: | ||
[[category: 機械学習]] | [[category: 機械学習]] | ||
− |