Q学習

提供: MonoBook
2017年3月29日 (水) 02:06時点における103.22.200.102 (トーク)による版 (ページの作成:「'''Q学習'''(英語:q-learning)とは、機械学習の手法のひとつである。 == 概要 == Q学習は古典的な機械学習手法である。...」)
(差分) ← 古い版 | 最新版 (差分) | 新しい版 → (差分)
ナビゲーションに移動 検索に移動

Q学習英語:q-learning)とは、機械学習の手法のひとつである。

概要

Q学習は古典的な機械学習手法である。

小難しい説明が多いようだが、大雑把にいえば、 関数qは、ある状況sにおいて、行動aを選択した場合の結果を得点を返す。 このQ(s,a)関数の行動aを変えまくって最高得点が出るパターンを力技で見つけるというものである。  Q(s, a)

行動aの試行回数を多くすれば性能は次第に向上する。 勉強に近道はないということだな。

2015年2月26日にグーグルが、 古典的なQ学習を流行りのディープラーニングに喰わせた「DQN (Deep Q Network)」という画期的な人工知能を発表し、とくに日本で話題となった[1]。なお、DQNの実装例としてはGoogleAlphaGoが有名であり、かなり賢い模様である。

関連項目

参考文献