「人工知能のパラメーター数」の版間の差分

 
24行目: 24行目:
  10億 * 32ビットfloat(4バイト) = 4GB
  10億 * 32ビットfloat(4バイト) = 4GB


このメモリ量を減らすのに16ビット(FP16/BF16)などに[[量子化]]する手法が流行っています。16ビット化すれば単純に半分程度になります。最近では1バイトの[[INT8]]や[[FP8]]、4ビットの[[ブロック浮動小数点数]]、2ビットの[[BitNet b1.58]]なども登場しています。
このメモリ量を減らすのに16ビット(FP16/BF16)などに[[量子化]]する手法が主流です。32ビットを16ビット化すれば単純にメモリ消費量は半分程度になります。最近では1バイトの[[INT8]]や[[FP8]]、4ビットの[[ブロック浮動小数点数]]、2ビットの[[BitNet b1.58]]なども登場しています。なおメモリを節約できる量子化ですが、やりすぎると性能がピーキーになるという欠点もあります。


=== 学習 ===
=== 学習 ===