「大規模言語モデル」の版間の差分
Administrator (トーク | 投稿記録) 編集の要約なし |
Administrator (トーク | 投稿記録) 編集の要約なし |
||
| (同じ利用者による、間の2版が非表示) | |||
| 1行目: | 1行目: | ||
'''大規模言語モデル'''(英語:Large Language Models、通称:LLM)とは、膨大な[[データセット]]と[[ディープラーニング]]を用いて構築された高度な[[自然言語処理モデル]]です。 | |||
従来の言語モデルと比較して、「計算量」「データ量」「パラメータ数」の3つの要素を大幅に増加させることで、人間に近い流暢な会話や高精度な言語処理を実現しています。 | 従来の言語モデルと比較して、「計算量」「データ量」「パラメータ数」の3つの要素を大幅に増加させることで、人間に近い流暢な会話や高精度な言語処理を実現しています。 | ||
[[ChatGPT]]が驚異的な性能を示したことで、それ以降は「自然言語処理モデル≒大規模言語モデル」という状況になっています。 | 2022年11月に公開された[[ChatGPT]]が驚異的な性能を示したことで、それ以降は「自然言語処理モデル≒大規模言語モデル」という状況になっています。 | ||
[[category: 大規模言語モデル]] | [[category: 大規模言語モデル]] | ||
[[category: LLM]] | |||