強化学習

強化学習（Reinforcement Learning）とは、機械学習の一種であり、複雑な環境下で最適な行動を学習することを目的としたアルゴリズムのことを指します。

強化学習は、人間が日常的に行う学習に似ており、反復的に試行錯誤を繰り返しながら学習します。

強化学習は、報酬（reward）と罰（penalty）を使い、システムが環境を探索しながら自らの意思決定を行い、自分の学習を促す方法です。