強化学習

提供: MonoBook
2022年12月6日 (火) 05:36時点におけるAdministrator (トーク | 投稿記録)による版 (ページの作成:「強化学習(Reinforcement Learning)とは、機械学習の一種であり、複雑な環境下で最適な行動を学習することを目的としたアル…」)
(差分) ← 古い版 | 最新版 (差分) | 新しい版 → (差分)
ナビゲーションに移動 検索に移動

強化学習(Reinforcement Learning)とは、機械学習の一種であり、複雑な環境下で最適な行動を学習することを目的としたアルゴリズムのことを指します。

強化学習は、人間が日常的に行う学習に似ており、反復的に試行錯誤を繰り返しながら学習します。

強化学習は、報酬(reward)と罰(penalty)を使い、システムが環境を探索しながら自らの意思決定を行い、自分の学習を促す方法です。

強化学習は、複雑な環境下での決断を行うタスクに適しており、ゲームなどの対戦や、ロボットなどの動作学習などに用いられます。