コンテンツにスキップ
メインメニュー
メインメニュー
サイドバーに移動
非表示
案内
メインページ
最近の更新
未作成ページ
おまかせ表示
ヘルプ
MonoBook
検索
検索
ログイン
個人用ツール
ログイン
ログアウトした編集者のページ
もっと詳しく
投稿記録
トーク
「
人工知能のパラメーター数
」を編集中
ページ
議論
日本語
閲覧
編集
ソースを編集
履歴表示
ツール
ツール
サイドバーに移動
非表示
操作
閲覧
編集
ソースを編集
履歴表示
全般
リンク元
関連ページの更新状況
特別ページ
ページ情報
2026年5月15日 (金) 05:37時点における
Administrator
(
トーク
|
投稿記録
)
による版
(
→学習
)
(
差分
)
← 古い版
|
最新版
(
差分
) |
新しい版 →
(
差分
)
警告: このページの古い版を編集しています。
公開すると、この版以降になされた変更がすべて失われます。
警告:
ログインしていません。編集を行うと、あなたの IP アドレスが公開されます。
ログイン
または
アカウントを作成
すれば、あなたの編集はその利用者名とともに表示されるほか、その他の利点もあります。
スパム攻撃防止用のチェックです。 けっして、ここには、値の入力は
しない
でください!
'''人工知能のパラメーター数'''とは、その[[人工知能]]が[[プログラム]]中で使用している([[メモリ]]に保持している)[[行列]]や[[ベクトル]]の総数です。 <source lang="python"> import torch # 例えば、1000個の入力から500個の出力へ変換する層のパラメータ # 重み: (出力数, 入力数) の行列 weights = torch.randn(500, 1000) # バイアス: (出力数) のベクトル bias = torch.randn(500) # パラメータ数 = 500 * 1000 + 500 = 500,500 </source> 数字がデカければ賢いという単純なものではありませんが、パラメータが多いほどモデルの表現力が増し、より複雑な文脈やニュアンスを理解・表現でき、高性能になる傾向があります。 2025年ごろからパラメーターを盛り盛りする競争が発生し、そのために必要な[[メモリ]]が争奪戦になっています。なお、[[SSD]]の価格も上がっていますが、こちらはただの便乗値上げです。 == 必要となる推定メモリ量 == === 推論 === ざっくり推論は「10億パラメーター(1B)あたり4GB」です。 10億 * 32ビットfloat(4バイト) = 4GB このメモリ量を減らすのに16ビット(FP16/BF16)などに量子化する手法が流行っています。 16ビット化すれば単純に半分程度になります。 === 学習 === 一方でフル学習は推論の4〜6倍の「10億パラメータ(1B)あたり16〜24GB」です。 10億 * 32ビットfloat(4バイト) * 4 = 16GB 10億 * 32ビットfloat(4バイト) * 6 = 24GB 推論の4〜6倍にもなるのはオプティマイザ(AdamWなど)や勾配(Gradients)の保持に大量のメモリを消費するためです。学習では推論と違ってこちらは全体を量子化してガツンとメモリを節約するのは難しいですが、オプティマイザや勾配などの一部分だけを16ビット化したりする手法は考案されています。 [[category: 人工知能]]
編集内容の要約:
MonoBookへの投稿はすべて、他の投稿者によって編集、変更、除去される場合があります。 自分が書いたものが他の人に容赦なく編集されるのを望まない場合は、ここに投稿しないでください。
また、投稿するのは、自分で書いたものか、パブリック ドメインまたはそれに類するフリーな資料からの複製であることを約束してください(詳細は
MonoBook:著作権
を参照)。
著作権保護されている作品は、許諾なしに投稿しないでください!
このページを編集するには、下記の確認用の質問に回答してください (
詳細
):
1たす1は?(全角で入力してください)
キャンセル
編集の仕方
(新しいウィンドウで開きます)
本文の横幅制限を有効化/無効化