コンテンツにスキップ
メインメニュー
メインメニュー
サイドバーに移動
非表示
案内
メインページ
最近の更新
未作成ページ
おまかせ表示
ヘルプ
MonoBook
検索
検索
ログイン
個人用ツール
ログイン
ログアウトした編集者のページ
もっと詳しく
投稿記録
トーク
「
FMA演算
」を編集中
ページ
議論
日本語
閲覧
編集
ソースを編集
履歴表示
ツール
ツール
サイドバーに移動
非表示
操作
閲覧
編集
ソースを編集
履歴表示
全般
リンク元
関連ページの更新状況
特別ページ
ページ情報
2024年8月16日 (金) 03:01時点における
Administrator
(
トーク
|
投稿記録
)
による版
(
差分
)
← 古い版
|
最新版
(
差分
) |
新しい版 →
(
差分
)
警告: このページの古い版を編集しています。
公開すると、この版以降になされた変更がすべて失われます。
警告:
ログインしていません。編集を行うと、あなたの IP アドレスが公開されます。
ログイン
または
アカウントを作成
すれば、あなたの編集はその利用者名とともに表示されるほか、その他の利点もあります。
スパム攻撃防止用のチェックです。 けっして、ここには、値の入力は
しない
でください!
'''FMA演算'''(Fused Multiply-Add、融合積和演算)とは、乗算と加算を1命令で行う演算です。 * 乗算と加算を2命令で実行するより速い * 乗算と加算を2命令で実行する場合より丸め誤差が小さい 数式で表すと <code>x * y + z</code> となります。この数式は「[[行列の乗算]]」や「[[ベクトルの内積]]」でよく使われます。[[行列]]と[[ベクトル]]といえば[[SIMD演算]]の効果が絶大なので昨今の[[CPU]]の[[SIMD]]命令や[[GPU]]では「FMA演算をSIMD実行できる機能(1命令で複数データにFMA演算を行う機能)」が定番機能となっています。 このFMA演算を[[CPU]]や[[GPU]]において1命令で行うことで途中の積算を丸めずに積和演算を最終演算結果の誤差を小さくする工夫が考案されており、IEEE 754規格の2008年改訂版で標準化されています。これに準拠したCPUやGPUでの挙動は常に一定となります。 === C言語 === C言語だと以下のような感じです。標準的な環境ではmath.hにfma関数があります。 <source lang="c"> #include <stdio.h> #include <math.h> int main() { double a = 2.0; double b = 3.0; double c = 4.0; double result; // FMAを使用して a * b + c を計算 result = fma(a, b, c); printf("Result of FMA: %f\n", result); return 0; } </source> === ベクトルの内積 === ベクトルの内積は「FMAの繰り返し」で計算できます。 ベクトルの内積は3DCGにおけるライティングやテクスチャマッピングのUV座標変換で多用されます。 <source lang="c"> #include <stdio.h> #include <math.h> #define SIZE 3 int main() { double vec1[SIZE] = {1.0, 2.0, 3.0}; double vec2[SIZE] = {4.0, 5.0, 6.0}; double dot_product = 0.0; for (int i = 0; i < SIZE; i++) { dot_product = fma(vec1[i], vec2[i], dot_product); } printf("Dot product: %f\n", dot_product); return 0; } </source> === 行列の乗算 === 行列の乗算は各要素の積とその総和を計算するためFMAの特性が非常に役立ちます。 行列の乗算は3DCGにおいては主に各種座標変換(ワールド座標変換やビュー座標変換など)で使われます。 また昨今の機械学習においては演算のほとんどが行列の乗算という状況です。 <source lang="c"> #include <stdio.h> #include <math.h> #define SIZE 3 void matrix_multiply(double mat1[SIZE][SIZE], double mat2[SIZE][SIZE], double result[SIZE][SIZE]) { for (int i = 0; i < SIZE; i++) { for (int j = 0; j < SIZE; j++) { result[i][j] = 0.0; for (int k = 0; k < SIZE; k++) { result[i][j] = fma(mat1[i][k], mat2[k][j], result[i][j]); } } } } int main() { double mat1[SIZE][SIZE] = { {1.0, 2.0, 3.0}, {4.0, 5.0, 6.0}, {7.0, 8.0, 9.0} }; double mat2[SIZE][SIZE] = { {9.0, 8.0, 7.0}, {6.0, 5.0, 4.0}, {3.0, 2.0, 1.0} }; double result[SIZE][SIZE]; matrix_multiply(mat1, mat2, result); printf("Result matrix:\n"); for (int i = 0; i < SIZE; i++) { for (int j = 0; j < SIZE; j++) { printf("%f ", result[i][j]); } printf("\n"); } return 0; } </source> [[category: CPU]] [[category: GPU]] [[category: 3DCG]] [[category: 機械学習]]
編集内容の要約:
MonoBookへの投稿はすべて、他の投稿者によって編集、変更、除去される場合があります。 自分が書いたものが他の人に容赦なく編集されるのを望まない場合は、ここに投稿しないでください。
また、投稿するのは、自分で書いたものか、パブリック ドメインまたはそれに類するフリーな資料からの複製であることを約束してください(詳細は
MonoBook:著作権
を参照)。
著作権保護されている作品は、許諾なしに投稿しないでください!
このページを編集するには、下記の確認用の質問に回答してください (
詳細
):
1たす1は?(全角で入力してください)
キャンセル
編集の仕方
(新しいウィンドウで開きます)
本文の横幅制限を有効化/無効化