「Q学習」を編集中

ナビゲーションに移動 検索に移動

警告: ログインしていません。編集を行うと、あなたの IP アドレスが公開されます。ログインまたはアカウントを作成すれば、あなたの編集はその利用者名とともに表示されるほか、その他の利点もあります。

この編集を取り消せます。 下記の差分を確認して、本当に取り消していいか検証してください。よろしければ変更を保存して取り消しを完了してください。

最新版 編集中の文章
5行目: 5行目:
  
 
Q学習で[[ググる]]と小難しい説明が多いようだが、大雑把にいえば、
 
Q学習で[[ググる]]と小難しい説明が多いようだが、大雑把にいえば、
関数qは、ある状況sにおいて、行動aを選択した場合の結果を得点(報酬)として返す。
+
関数qは、ある状況sにおいて、行動aを選択した場合の結果を得点として返す。
 
このQ(s,a)関数の行動aを変えまくって最高得点が出るパターンを力技で見つけるというものである。
 
このQ(s,a)関数の行動aを変えまくって最高得点が出るパターンを力技で見つけるというものである。
「力こそパワー」である。
 
 
  Q(s, a)
 
  Q(s, a)
  
13行目: 12行目:
 
勉強に近道はないということだな。
 
勉強に近道はないということだな。
  
2015年2月26日にグーグルでAlphaGoを作った人たちが、
+
2015年2月26日にグーグルが、
古典的なQ学習を、流行りの[[ディープラーニング]]に喰わせた「[[DQN (Deep Q Network)]]」という画期的な人工知能を発表し、とくに日本で話題となった<ref>[https://news.yahoo.co.jp/pickup/6151054 Yahoo!ニュース グーグル開発の人工知能、その名も「DQN」ネットでは「命名事故?」「奇跡的」]</ref><ref>[http://getnews.jp/archives/1481281 Google人工知能「賢いDQN」にネット困惑]</ref>。
+
古典的なQ学習を、流行りの[[ディープラーニング]]に喰わせた「[[DQN (Deep Q Network)]]」という画期的な人工知能を発表し、とくに日本で話題となった<ref name="yahoo">[http://headlines.yahoo.co.jp/hl?a=20150226-00000001-withnews-sci Yahoo!ニュース グーグル開発の人工知能、その名も「DQN」ネットでは「命名事故?」「奇跡的」]</ref>。なお、[[DQN]]の実装例としては[[Google]]の[[AlphaGo]]が有名であり、かなり賢い模様である。
  
 
== 関連項目 ==
 
== 関連項目 ==
25行目: 24行目:
  
 
[[category: 機械学習]]
 
[[category: 機械学習]]
[[category: 人工知能]]
 

MonoBookへの投稿はすべて、他の投稿者によって編集、変更、除去される場合があります。 自分が書いたものが他の人に容赦なく編集されるのを望まない場合は、ここに投稿しないでください。
また、投稿するのは、自分で書いたものか、パブリック ドメインまたはそれに類するフリーな資料からの複製であることを約束してください(詳細はMonoBook:著作権を参照)。 著作権保護されている作品は、許諾なしに投稿しないでください!

このページを編集するには、下記の確認用の質問に回答してください (詳細):

取り消し 編集の仕方 (新しいウィンドウで開きます)

このページで使用されているテンプレート:

このページは 1 個の隠しカテゴリに属しています: