Tensorコア

提供: MonoBook
2023年5月15日 (月) 05:23時点におけるAdministrator (トーク | 投稿記録)による版
(差分) ← 古い版 | 最新版 (差分) | 新しい版 → (差分)
ナビゲーションに移動 検索に移動

Tensorコアとは、NVIDIAが開発した高速な深層学習演算を実行するためのGPUに搭載された専用ハードウェアユニットです。

通常のCUDAコアから深層学習では使われない余計な機能をバッサリ切り落とし、行列演算(とくに行列の乗算)を高速に実行することに特化させたものです。

深層学習においては行列演算が頻繁に行われるため、特に大規模なニューラルネットワークを使用する場合に効果的であり、高速な学習を実現することができます。一方でゲームでは行列演算は頂点シェーダーで使われるくらいなのであまり高速化は望めません。

Tensorコアは、NVIDIAのVoltaアーキテクチャ以降のGPUに搭載されています。

Tensorコアは、TensorFlowPyTorchMXNetなどのライブラリに統合されており、比較的簡単に高速な深層学習アプリケーションを開発することができます。