「強化学習」の版間の差分

提供:MonoBook
ページの作成:「強化学習(Reinforcement Learning)とは、機械学習の一種であり、複雑な環境下で最適な行動を学習することを目的としたアル…」
 
編集の要約なし
 
1行目: 1行目:
強化学習(Reinforcement Learning)とは、[[機械学習]]の一種であり、複雑な環境下で最適な行動を学習することを目的とした[[アルゴリズム]]のことを指します。
'''強化学習'''(Reinforcement Learning)とは、[[機械学習]]の一種であり、複雑な環境下で最適な行動を学習することを目的とした[[アルゴリズム]]のことを指します。


強化学習は、人間が日常的に行う学習に似ており、反復的に試行錯誤を繰り返しながら学習します。
強化学習は、人間が日常的に行う学習に似ており、反復的に試行錯誤を繰り返しながら学習します。
6行目: 6行目:


強化学習は、複雑な環境下での決断を行うタスクに適しており、[[ゲーム]]などの対戦や、[[ロボット]]などの動作学習などに用いられます。
強化学習は、複雑な環境下での決断を行うタスクに適しており、[[ゲーム]]などの対戦や、[[ロボット]]などの動作学習などに用いられます。
== 関連項目 ==
* [[人工知能]]
** [[機械学習]]

2022年12月22日 (木) 02:18時点における最新版

強化学習(Reinforcement Learning)とは、機械学習の一種であり、複雑な環境下で最適な行動を学習することを目的としたアルゴリズムのことを指します。

強化学習は、人間が日常的に行う学習に似ており、反復的に試行錯誤を繰り返しながら学習します。

強化学習は、報酬(reward)と罰(penalty)を使い、システムが環境を探索しながら自らの意思決定を行い、自分の学習を促す方法です。

強化学習は、複雑な環境下での決断を行うタスクに適しており、ゲームなどの対戦や、ロボットなどの動作学習などに用いられます。

関連項目[編集 | ソースを編集]