大規模言語モデル

2025年12月16日 (火) 03:57時点におけるAdministrator (トーク | 投稿記録)による版
(差分) ← 古い版 | 最新版 (差分) | 新しい版 → (差分)

大規模言語モデル(英語:Large Language Models、通称:LLM)とは、膨大なデータセットディープラーニングを用いて構築された高度な自然言語処理モデルです。

従来の言語モデルと比較して、「計算量」「データ量」「パラメータ数」の3つの要素を大幅に増加させることで、人間に近い流暢な会話や高精度な言語処理を実現しています。

2022年11月に公開されたChatGPTが驚異的な性能を示したことで、それ以降は「自然言語処理モデル≒大規模言語モデル」という状況になっています。