「Bfloat16」の版間の差分

2021年6月15日 (火) 08:53時点における版

bfloat16 (brain floating point、BF16)とは、浮動小数点を16ビット長で表す形式のひとつである。

GoogleがTensorFlow向けに開発しているもの。

BF16は「単純にFP32の仮数部を切り詰めた」というものである。汎用的なFP16に対して、BF16は「FP32から高速変換できる」のが利点で、出し入れの激しい人工知能向けだと言われている。

FP32からBF16への丸め処理の発動条件は

@@ 54行目: / 54行目: @@
 |}
-FP32からBF16への丸め処理は「FP32の仮数部の8ビット目が重要」となる。
+FP32からBF16への丸め処理の発動条件は
+* FP32の仮数部の「7ビット目が0」かつ「8ビット目が1」
 ==主なBF16をサポートする製品==