720 バイト追加,
2022年12月6日 (火) 05:36 強化学習(Reinforcement Learning)とは、[[機械学習]]の一種であり、複雑な環境下で最適な行動を学習することを目的とした[[アルゴリズム]]のことを指します。
強化学習は、人間が日常的に行う学習に似ており、反復的に試行錯誤を繰り返しながら学習します。
強化学習は、報酬(reward)と罰(penalty)を使い、システムが環境を探索しながら自らの意思決定を行い、自分の学習を促す方法です。
強化学習は、複雑な環境下での決断を行うタスクに適しており、[[ゲーム]]などの対戦や、[[ロボット]]などの動作学習などに用いられます。