「Q学習」の版間の差分

提供: MonoBook
ナビゲーションに移動 検索に移動
12行目: 12行目:
 
勉強に近道はないということだな。
 
勉強に近道はないということだな。
  
2015年2月26日にグーグルが、
+
2015年2月26日にグーグルでAlphaGoを作った人たちが、
古典的なQ学習を、流行りの[[ディープラーニング]]に喰わせた「[[DQN (Deep Q Network)]]」という画期的な人工知能を発表し、とくに日本で話題となった<ref name="yahoo">[https://news.yahoo.co.jp/pickup/6151054 Yahoo!ニュース グーグル開発の人工知能、その名も「DQN」ネットでは「命名事故?」「奇跡的」]</ref>。なお、[[DQN]]の実装例としては[[Google]]の[[AlphaGo]]が有名であり、かなり賢い模様である。
+
古典的なQ学習を、流行りの[[ディープラーニング]]に喰わせた「[[DQN (Deep Q Network)]]」という画期的な人工知能を発表し、とくに日本で話題となった<ref>[https://news.yahoo.co.jp/pickup/6151054 Yahoo!ニュース グーグル開発の人工知能、その名も「DQN」ネットでは「命名事故?」「奇跡的」]</ref><ref>[Google人工知能「賢いDQN」にネット困惑 http://getnews.jp/archives/1481281]</ref>。
  
 
== 関連項目 ==
 
== 関連項目 ==

2017年3月29日 (水) 02:27時点における版

Q学習英語:q-learning)とは、機械学習の手法のひとつである。

概要

Q学習は古典的な機械学習手法である。

Q学習でググると小難しい説明が多いようだが、大雑把にいえば、 関数qは、ある状況sにおいて、行動aを選択した場合の結果を得点として返す。 このQ(s,a)関数の行動aを変えまくって最高得点が出るパターンを力技で見つけるというものである。

Q(s, a)

行動aの試行回数を多くすれば性能は次第に向上する。 勉強に近道はないということだな。

2015年2月26日にグーグルでAlphaGoを作った人たちが、 古典的なQ学習を、流行りのディープラーニングに喰わせた「DQN (Deep Q Network)」という画期的な人工知能を発表し、とくに日本で話題となった[1][2]

関連項目

参考文献