「Q学習」の版間の差分
ナビゲーションに移動
検索に移動
4行目: | 4行目: | ||
Q学習は古典的な機械学習手法である。 | Q学習は古典的な機械学習手法である。 | ||
− | + | Q学習で[[ググる]]と小難しい説明が多いようだが、大雑把にいえば、 | |
− | + | 関数qは、ある状況sにおいて、行動aを選択した場合の結果を得点として返す。 | |
このQ(s,a)関数の行動aを変えまくって最高得点が出るパターンを力技で見つけるというものである。 | このQ(s,a)関数の行動aを変えまくって最高得点が出るパターンを力技で見つけるというものである。 | ||
Q(s, a) | Q(s, a) |
2017年3月29日 (水) 02:07時点における版
Q学習(英語:q-learning)とは、機械学習の手法のひとつである。
概要
Q学習は古典的な機械学習手法である。
Q学習でググると小難しい説明が多いようだが、大雑把にいえば、 関数qは、ある状況sにおいて、行動aを選択した場合の結果を得点として返す。 このQ(s,a)関数の行動aを変えまくって最高得点が出るパターンを力技で見つけるというものである。
Q(s, a)
行動aの試行回数を多くすれば性能は次第に向上する。 勉強に近道はないということだな。
2015年2月26日にグーグルが、 古典的なQ学習を流行りのディープラーニングに喰わせた「DQN (Deep Q Network)」という画期的な人工知能を発表し、とくに日本で話題となった[1]。なお、DQNの実装例としてはGoogleのAlphaGoが有名であり、かなり賢い模様である。