「Q学習」の版間の差分

2017年3月29日 (水) 02:06時点における版

Q学習（英語：q-learning）とは、機械学習の手法のひとつである。

Q学習は古典的な機械学習手法である。

小難しい説明が多いようだが、大雑把にいえば、関数qは、ある状況sにおいて、行動aを選択した場合の結果を得点を返す。このQ(s,a)関数の行動aを変えまくって最高得点が出るパターンを力技で見つけるというものである。

Q(s, a)

行動aの試行回数を多くすれば性能は次第に向上する。勉強に近道はないということだな。

2015年2月26日にグーグルが、古典的なQ学習を流行りのディープラーニングに喰わせた「DQN (Deep Q Network)」という画期的な人工知能を発表し、とくに日本で話題となった^[1]。なお、DQNの実装例としてはGoogleのAlphaGoが有名であり、かなり賢い模様である。

	この項目「Q学習」は、まだ書きかけの項目です。加筆、訂正などをして下さる協力者を求めています。
このテンプレートは分野別のスタブテンプレート（Monobook:スタブカテゴリ参照）に変更することが望まれています。

@@ 7行目: / 7行目: @@
 関数qは、ある状況sにおいて、行動aを選択した場合の結果を得点を返す。
 このQ(s,a)関数の行動aを変えまくって最高得点が出るパターンを力技で見つけるというものである。
-　Q(s, a)
+ Q(s, a)
 行動aの試行回数を多くすれば性能は次第に向上する。