「Q学習」の版間の差分

編集の要約なし
 
(同じ利用者による、間の6版が非表示)
4行目: 4行目:
Q学習は古典的な機械学習手法である。
Q学習は古典的な機械学習手法である。


小難しい説明が多いようだが、大雑把にいえば、
Q学習で[[ググる]]と小難しい説明が多いようだが、大雑把にいえば、
関数qは、ある状況sにおいて、行動aを選択した場合の結果を得点を返す。
関数qは、ある状況sにおいて、行動aを選択した場合の結果を得点(報酬)として返す。
このQ(s,a)関数の行動aを変えまくって最高得点が出るパターンを力技で見つけるというものである。
このQ(s,a)関数の行動aを変えまくって最高得点が出るパターンを力技で見つけるというものである。
「力こそパワー」である。
  Q(s, a)
  Q(s, a)


12行目: 13行目:
勉強に近道はないということだな。
勉強に近道はないということだな。


2015年2月26日にグーグルが、
2015年2月26日にグーグルでAlphaGoを作った人たちが、
古典的なQ学習を流行りの[[ディープラーニング]]に喰わせた「[[DQN (Deep Q Network)]]」という画期的な人工知能を発表し、とくに日本で話題となった<ref name="yahoo">[http://headlines.yahoo.co.jp/hl?a=20150226-00000001-withnews-sci Yahoo!ニュース グーグル開発の人工知能、その名も「DQN」ネットでは「命名事故?」「奇跡的」]</ref>。なお、[[DQN]]の実装例としては[[Google]]の[[AlphaGo]]が有名であり、かなり賢い模様である。
古典的なQ学習を、流行りの[[ディープラーニング]]に喰わせた「[[DQN (Deep Q Network)]]」という画期的な人工知能を発表し、とくに日本で話題となった<ref>[https://news.yahoo.co.jp/pickup/6151054 Yahoo!ニュース グーグル開発の人工知能、その名も「DQN」ネットでは「命名事故?」「奇跡的」]</ref><ref>[http://getnews.jp/archives/1481281 Google人工知能「賢いDQN」にネット困惑]</ref>。


== 関連項目 ==
== 関連項目 ==
24行目: 25行目:


[[category: 機械学習]]
[[category: 機械学習]]
[[category: 人工知能]]