差分

← 古い編集

Q学習

83 バイト追加, 2017年3月29日 (水) 02:34

Q学習は古典的な機械学習手法である。

~~小難しい説明が多いようだが、大雑把にいえば、~~Q学習で[[ググる]]と小難しい説明が多いようだが、大雑把にいえば、~~関数qは、ある状況sにおいて、行動aを選択した場合の結果を得点を返す。~~関数qは、ある状況sにおいて、行動aを選択した場合の結果を得点（報酬）として返す。

このQ(s,a)関数の行動aを変えまくって最高得点が出るパターンを力技で見つけるというものである。

　Q「力こそパワー」である。 Q(s, a)

行動aの試行回数を多くすれば性能は次第に向上する。

勉強に近道はないということだな。

~~2015年2月26日にグーグルが、~~2015年2月26日にグーグルでAlphaGoを作った人たちが、~~古典的なQ学習を流行りの~~古典的なQ学習を、流行りの[[ディープラーニング]]に喰わせた「[[DQN (Deep Q Network)]]」という画期的な人工知能を発表し、とくに日本で話題となった<ref ~~name="yahoo"~~>[~~http~~https://~~headlines~~news.yahoo.co.jp/~~hl?a=20150226-00000001-withnews-sci~~ pickup/6151054 Yahoo！ニュースグーグル開発の人工知能、その名も「DQN」ネットでは「命名事故？」「奇跡的」]</ref>~~。なお、~~<ref>[~~[DQN~~http://getnews.jp/archives/1481281 Google人工知能「賢いDQN」にネット困惑]~~]の実装例としては[[Google]]の[[AlphaGo]]が有名であり、かなり賢い模様である。~~</ref>。

== 関連項目 ==

[[category: 機械学習]]

[[category: 人工知能]]

匿名利用者

103.22.200.102