「Q学習」の版間の差分

提供: MonoBook
ナビゲーションに移動 検索に移動
 
(同じ利用者による、間の1版が非表示)
5行目: 5行目:
  
 
Q学習で[[ググる]]と小難しい説明が多いようだが、大雑把にいえば、
 
Q学習で[[ググる]]と小難しい説明が多いようだが、大雑把にいえば、
関数qは、ある状況sにおいて、行動aを選択した場合の結果を得点として返す。
+
関数qは、ある状況sにおいて、行動aを選択した場合の結果を得点(報酬)として返す。
 
このQ(s,a)関数の行動aを変えまくって最高得点が出るパターンを力技で見つけるというものである。
 
このQ(s,a)関数の行動aを変えまくって最高得点が出るパターンを力技で見つけるというものである。
 +
「力こそパワー」である。
 
  Q(s, a)
 
  Q(s, a)
  
24行目: 25行目:
  
 
[[category: 機械学習]]
 
[[category: 機械学習]]
 +
[[category: 人工知能]]

2017年3月29日 (水) 02:34時点における最新版

Q学習英語:q-learning)とは、機械学習の手法のひとつである。

概要[編集 | ソースを編集]

Q学習は古典的な機械学習手法である。

Q学習でググると小難しい説明が多いようだが、大雑把にいえば、 関数qは、ある状況sにおいて、行動aを選択した場合の結果を得点(報酬)として返す。 このQ(s,a)関数の行動aを変えまくって最高得点が出るパターンを力技で見つけるというものである。 「力こそパワー」である。

Q(s, a)

行動aの試行回数を多くすれば性能は次第に向上する。 勉強に近道はないということだな。

2015年2月26日にグーグルでAlphaGoを作った人たちが、 古典的なQ学習を、流行りのディープラーニングに喰わせた「DQN (Deep Q Network)」という画期的な人工知能を発表し、とくに日本で話題となった[1][2]

関連項目[編集 | ソースを編集]

参考文献[編集 | ソースを編集]