差分

新しい編集 →

Q学習

1,294 バイト追加, 2017年3月29日 (水) 02:06

ページの作成:「'''Q学習'''（英語：q-learning）とは、機械学習の手法のひとつである。 == 概要 == Q学習は古典的な機械学習手法である。...」

'''Q学習'''（[[英語]]：q-learning）とは、[[機械学習]]の手法のひとつである。

== 概要 ==
Q学習は古典的な機械学習手法である。

小難しい説明が多いようだが、大雑把にいえば、
関数qは、ある状況sにおいて、行動aを選択した場合の結果を得点を返す。
このQ(s,a)関数の行動aを変えまくって最高得点が出るパターンを力技で見つけるというものである。
　Q(s, a)

行動aの試行回数を多くすれば性能は次第に向上する。
勉強に近道はないということだな。

2015年2月26日にグーグルが、
古典的なQ学習を流行りの[[ディープラーニング]]に喰わせた「[[DQN (Deep Q Network)]]」という画期的な人工知能を発表し、とくに日本で話題となった<ref name="yahoo">[http://headlines.yahoo.co.jp/hl?a=20150226-00000001-withnews-sci Yahoo！ニュースグーグル開発の人工知能、その名も「DQN」ネットでは「命名事故？」「奇跡的」]</ref>。なお、[[DQN]]の実装例としては[[Google]]の[[AlphaGo]]が有名であり、かなり賢い模様である。

== 関連項目 ==
* [[DQN (人工知能)]]

== 参考文献 ==
{{reflist}}

{{stub}}

[[category: 機械学習]]

匿名利用者

103.22.200.102