「人工知能のパラメーター数」の版間の差分

編集の要約なし
編集の要約なし
18行目: 18行目:


2025年ごろからパラメーターを盛り盛りする競争が発生し、そのために必要な[[メモリ]]が争奪戦になっています。なお、[[SSD]]の価格も上がっていますが、こちらはただの便乗値上げです。
2025年ごろからパラメーターを盛り盛りする競争が発生し、そのために必要な[[メモリ]]が争奪戦になっています。なお、[[SSD]]の価格も上がっていますが、こちらはただの便乗値上げです。
== 必要となる推定メモリ量 ==
ざっくり推論は「10億パラメーター(1B)あたり4GB」です。
10億 * 32ビットfloat(4バイト) = 4GB
量子化すればどんどん小さくなります。
一方でフル学習はその4〜6倍の「10億パラメータ(1B)あたり16〜24GB」です。
オプティマイザ(AdamWなど)や勾配(Gradients)の保持に大量のメモリを消費するためです。


[[category: 人工知能]]
[[category: 人工知能]]