コンテンツにスキップ
メインメニュー
メインメニュー
サイドバーに移動
非表示
案内
メインページ
最近の更新
未作成ページ
おまかせ表示
ヘルプ
MonoBook
検索
検索
ログイン
個人用ツール
ログイン
ログアウトした編集者のページ
もっと詳しく
投稿記録
トーク
「
FP8
」を編集中
ページ
議論
日本語
閲覧
編集
ソースを編集
履歴表示
ツール
ツール
サイドバーに移動
非表示
操作
閲覧
編集
ソースを編集
履歴表示
全般
リンク元
関連ページの更新状況
特別ページ
ページ情報
警告:
ログインしていません。編集を行うと、あなたの IP アドレスが公開されます。
ログイン
または
アカウントを作成
すれば、あなたの編集はその利用者名とともに表示されるほか、その他の利点もあります。
スパム攻撃防止用のチェックです。 けっして、ここには、値の入力は
しない
でください!
'''FP8'''(えふぴーえいと)とは、[[ARM]]と[[Intel]]と[[NVIDIA]]の3社が共同で仕様を策定した「8ビットの浮動小数点数」です。ホワイトペーパーでは「reduced precision floating-point」となっているので日本語訳は「[[低精度浮動小数点数]]」でいいと思う。 主にNVIDIAのHopperアーキテクチャ以降(H100など)でサポートされ、従来のFP16/BF16と比較して約2倍の処理速度を実現し、大規模言語モデル(LLM)や生成AIの学習・推論を高速化します。 == 形式 == FP8には[[指数]]Eと[[仮数]]Mのビット数が異なる2種類の形式がある。 === E5M2 === * 符号ビット: 1ビット * 指数部の幅: 5ビット * 仮数部の幅: 2ビット E5M2は「指数5ビット」「仮数2ビット」の形式である。IEEE 754の16ビット形式である「[[FP16]]」の仮数部を10ビットから2ビットにしたものとなっている。「[[FP32]]と[[bfloat16]]」の関係と同じく「[[FP16]]とFP8は互換性がある」ということらしい。FP16で書かれた[[ソースコード]]を単純に文字列置換するだけで使えるのが利点らしい。E5M2は「[[勾配テンソル]]」に最適らしいぞ。 === E4M3 === * 符号ビット: 1ビット * 指数部の幅: 4ビット * 仮数部の幅: 3ビット [[category: 浮動小数点数]] E4M3はE5M2よりダイナミックレンジが広い。E4M3は「[[重みテンソル]]」および「[[活性化テンソル]]」に最適らしいぞ。 == 主な対応ハードウェア == === NVIDIA === * 第4世代Tensorコア ** NVIDIA H100, H200 ** NVIDIA L4 ** RTX 6000, 4500, 4000 ** GeForce RTX 40シリーズ === Intel === * Intel Gaudi 3 * Intel Xeon の Intel AMX === ARM === * Armv9.2-A のSME (Scalable Matrix Extension) === AMD === * RDNA 4 ** Radeon RX 9000シリーズ == 外部リンク == * https://arxiv.org/abs/2209.05433 == 関連項目 == * [[単精度浮動小数点数]] ([[FP32]]) * [[半精度浮動小数点数]] ([[FP16]], [[bfloat16]]) * [[低精度浮動小数点数]] ([[FP8]]) [[category: 人工知能]]
編集内容の要約:
MonoBookへの投稿はすべて、他の投稿者によって編集、変更、除去される場合があります。 自分が書いたものが他の人に容赦なく編集されるのを望まない場合は、ここに投稿しないでください。
また、投稿するのは、自分で書いたものか、パブリック ドメインまたはそれに類するフリーな資料からの複製であることを約束してください(詳細は
MonoBook:著作権
を参照)。
著作権保護されている作品は、許諾なしに投稿しないでください!
このページを編集するには、下記の確認用の質問に回答してください (
詳細
):
1たす1は?(全角で入力してください)
キャンセル
編集の仕方
(新しいウィンドウで開きます)
本文の横幅制限を有効化/無効化