「AVX-512」の版間の差分
Administrator (トーク | 投稿記録) 編集の要約なし |
Administrator (トーク | 投稿記録) 編集の要約なし |
||
| 10行目: | 10行目: | ||
これにより「32ビット不動小数点数の4x4行列」=「512ビット」の演算を32並列で実行できるようになりました。もはや[[ベクトルプロセッサ]]と呼んでも差し支えなのないレベルになっています。 | これにより「32ビット不動小数点数の4x4行列」=「512ビット」の演算を32並列で実行できるようになりました。もはや[[ベクトルプロセッサ]]と呼んでも差し支えなのないレベルになっています。 | ||
ただAVX-512で無駄に巨大な回路がその他の部分の足枷になっているとも言われています。 | |||
[[シングルスレッド性能]]を追求するような場面ではとくに厳しいようです。 | |||
==関連項目== | ==関連項目== | ||
2025年3月25日 (火) 07:57時点における版
AVX-512とは、IntelのCPUのコードネーム「Skylake-X(Core iの7000番台の上位モデル)」から搭載されたx86の拡張命令セットです。
概要
AVX-512は本来サーバー向けとして開発されたものであり、当初はコンシューマー向けの製品には搭載されていませんでした。
AVX-512はGPUの並列処理に対抗すべく開発されたものであり従来のAVXとは大きく異なります。その中身は「Larrabee」および「Xeon Phi」の後続製品をCPUに内蔵したものです。
まず名称に「512」とあるようにSIMD演算のレジスタも512ビットになっています。 さらにこの512ビットのレジスタが32本もあります。1個ではなく32個。すごい。 これにより「32ビット不動小数点数の4x4行列」=「512ビット」の演算を32並列で実行できるようになりました。もはやベクトルプロセッサと呼んでも差し支えなのないレベルになっています。
ただAVX-512で無駄に巨大な回路がその他の部分の足枷になっているとも言われています。 シングルスレッド性能を追求するような場面ではとくに厳しいようです。