「SSE」の版間の差分
Administrator (トーク | 投稿記録) |
Administrator (トーク | 投稿記録) 編集の要約なし |
||
| (2人の利用者による、間の13版が非表示) | |||
| 1行目: | 1行目: | ||
'''ストリーミングSIMD拡張命令'''(英語:Streaming SIMD Extensions、通称:SSE)とは、[[インテル]] | '''ストリーミングSIMD拡張命令'''(英語:Streaming SIMD Extensions、通称:SSE)とは、[[インテル]]が[[Pentium III]]向けに開発した[[CPU]]の[[SIMD拡張命令セット]]、およびその拡張版の総称です。 | ||
== 概要 == | == 概要 == | ||
[[Pentium II]]と激闘を繰り広げた[[AMD]]の[[K6-2]]に実装された[[3DNow!]]に対抗すべく[[Pentium III]]に実装された[[SIMD]] | [[Pentium II]]と激闘を繰り広げた[[AMD]]の[[K6-2]]に実装された[[3DNow!]]に対抗すべく[[Pentium III]]に実装された[[SIMD]]命令群です。大雑把にいえばSSEは[[MMX]]を拡張したものであり、MMXでは[[整数演算]]だけだったものが、SSEでは[[浮動小数点演算]]にも対応しました。また、SSEでは新たに8本の128ビット[[レジスタ]]も追加されています。 | ||
== プログラミング == | == プログラミング == | ||
[[MMX | [[MMX]]や[[3DNow!]]、SSEが出た当初はまともな[[コンパイラ]]がなかったため、[[プログラマー]]は[[アセンブラ]]を用いてこれらに対応する[[プログラム]]を組んでいました。[[C言語]]や[[C++]]で大枠を書いて、[[インラインアセンブラ]]で部分的に高速化を試みるという書き方が主流でした。 | ||
後に機能強化された[[SSE2]]や[[SSE3]]、[[SSSE3]](Supplemental/補足的なSSE3)、[[SSE4]] | 後に機能強化された[[SSE2]]や[[SSE3]]、[[SSSE3]](Supplemental/補足的なSSE3)、[[SSE4]]などが登場していますが、この世代になると[[C言語]]などの[[コンパイラ]]も優秀になり[[アセンブラ]]で書くことはほとんどなくなりました。 | ||
== 実情 == | == 実情 == | ||
[[Windows]]で[[Visual C++]] | [[Windows]]で[[Visual C++]]が主流だった時代の[[ソフトウェア]]は99.9999%が「SSE非対応」どころか「[[i386]]」をターゲットに[[コンパイル]]されていました。これらはSSEどころか[[i486]]や[[Pentium]]の機能も使われていません。[[ソフトウェア]]は「[[最低動作環境]]」となる[[PC]]のスペックを下げることで「多くの人に使ってもらおう」という[[最小公倍数]]的な考え方であったためです。 | ||
[[MMX]]が登場した当初はその話題性から「MMX対応版」「MMX非対応版」といった二種類の実行ファイルを用意した[[ゲーム]]などもありましたが、[[3DNow!]]やSSEの時代になるとその話題性も薄れベンチマークソフトくらいしか対応ソフトがなくなりました。 | |||
また、ベンチマークソフトみたいに何秒間も負荷100%で砂時計カーソルを表示するような処理でもない限り大して速くはならないという事実が[[プログラマー]]たちに知れ渡り「開発コストに見合わない」という認識が広まったことで対応ソフトはどんどん減っていきました。 | |||
=== JITコンパイル === | |||
SSEがまともに使われだしたのは[[Java]]などの[[JITコンパイラ]]の技術が発達し「SSEの有無」を実行環境で判別してコンパイルするようになってからです。 | |||
[[ | ただ[[Java]]でSSEを使うような[[プログラム]]を書くかと言われると、まず書きません。 | ||
やっぱりベンチマークソフトくらいしか使われていません。 | |||
=== オープンソース界隈 === | |||
[[ソースコード]]を落としてきて実行環境でコンパイルするスタイルの[[オープンソース]]界隈ではなんぼか使われていました。一昔前は「[[apache]]や[[mysql]]の性能を向上させる方法!」などとして[[ググる]]とよく出てきていました。 | |||
ただ[[オープンソース]]界隈も[[CentOS]]や[[Ubuntu]]が主流になり、「[[configure; make; make install]]」が廃れ、パッケージからソフトウェアを入れるのが主流になったことでやっぱりベンチマークソフトくらいしか使われていません。 | |||
== ベンチマーク == | == ベンチマーク == | ||
=== 2019年時点 === | === 2019年時点 === | ||
SIMD関連のベンチマークでは[[インテル]]の[[Core i]]シリーズでは非常に高性能な結果が得られます。 | |||
[[インテル]]の[[Core i]] | |||
[[Ryzen]]はSIMDではなく[[GPGPU]] | 一方、[[AMD]]の[[Ryzen]]では微妙な結果になります。[[Ryzen]]はSIMDではなく[[GPGPU]]を使う前提で、SIMD周りをバッサリ切り捨て、その余力を通常の演算性能を上げることに使っているためです。 | ||
どちらも[[プログラム]] | どちらも[[プログラム]]の書き方が全く異なるため一概に「どちらが速い」とは言いにくいの実情です。プログラムがSSEに対応しているならIntel、GPGPUに対応しているならAMDの方が高速ということになります。ちなみに[[SSE]]と[[GPGPU]]に両対応している場合は一般的に[[GPU]]の方が速い傾向にあります。 | ||
== 歴史 == | == 歴史 == | ||
| 48行目: | 54行目: | ||
*2008年 11月: インテルが[[SSE4.2]]搭載の第一世代[[Intel Core i]]プロセッサを発表。 | *2008年 11月: インテルが[[SSE4.2]]搭載の第一世代[[Intel Core i]]プロセッサを発表。 | ||
*2011年 1月: インテルが[[AVX]]搭載の第二世代[[Intel Core i]]プロセッサを発表。 | *2011年 1月: インテルが[[AVX]]搭載の第二世代[[Intel Core i]]プロセッサを発表。 | ||
*2011年 10月: AMDが[[ | *2011年 10月: AMDが[[FMA]]搭載の[[AMD FX]]プロセッサを発表。 | ||
*2013年 6月: インテルが[[AVX2]]搭載の第四世代[[Intel Core i]]プロセッサを発表。 | *2013年 6月: インテルが[[AVX2]]搭載の第四世代[[Intel Core i]]プロセッサを発表。 | ||
*2016年 6月: インテルが[[AVX-512]]搭載の[[Intel Xeon Phi]]コプロセッサを発表。 | *2016年 6月: インテルが[[AVX-512]]搭載の[[Intel Xeon Phi]]コプロセッサを発表。 | ||
| 57行目: | 63行目: | ||
* [[AltiVec]] ([[Velocity Engine]]) | * [[AltiVec]] ([[Velocity Engine]]) | ||
* [[ベクトルプロセッサー]] | * [[ベクトルプロセッサー]] | ||
* [[Intel Image Processing Library]] | |||
[[category: CPU]] | |||
[[category: SIMD]] | |||