「AVX-512」の版間の差分

提供:MonoBook
編集の要約なし
編集の要約なし
10行目: 10行目:
これにより「32ビット不動小数点数の4x4行列」=「512ビット」の演算を32並列で実行できるようになりました。もはや[[ベクトルプロセッサ]]と呼んでも差し支えなのないレベルになっています。
これにより「32ビット不動小数点数の4x4行列」=「512ビット」の演算を32並列で実行できるようになりました。もはや[[ベクトルプロセッサ]]と呼んでも差し支えなのないレベルになっています。


ただ一方で無駄に巨大な回路が足枷になっているとも言われています。
ただAVX-512で無駄に巨大な回路がその他の部分の足枷になっているとも言われています。
[[シングルスレッド性能]]を追求するような場面ではとくに厳しいようです。


==関連項目==
==関連項目==

2025年3月25日 (火) 07:57時点における版

AVX-512とは、IntelCPUコードネームSkylake-X(Core iの7000番台の上位モデル)」から搭載されたx86の拡張命令セットです。

概要

AVX-512は本来サーバー向けとして開発されたものであり、当初はコンシューマー向けの製品には搭載されていませんでした。

AVX-512はGPUの並列処理に対抗すべく開発されたものであり従来のAVXとは大きく異なります。その中身は「Larrabee」および「Xeon Phi」の後続製品をCPUに内蔵したものです。

まず名称に「512」とあるようにSIMD演算レジスタも512ビットになっています。 さらにこの512ビットのレジスタが32本もあります。1個ではなく32個。すごい。 これにより「32ビット不動小数点数の4x4行列」=「512ビット」の演算を32並列で実行できるようになりました。もはやベクトルプロセッサと呼んでも差し支えなのないレベルになっています。

ただAVX-512で無駄に巨大な回路がその他の部分の足枷になっているとも言われています。 シングルスレッド性能を追求するような場面ではとくに厳しいようです。

関連項目