「定数バッファ」の版間の差分

提供: MonoBook
ナビゲーションに移動 検索に移動
5行目: 5行目:
  
 
== 概要 ==
 
== 概要 ==
[[CPU]]側で動く[[プログラム]]の[[変数]]を、[[GPU]]側で動く[[プログラマブルシェーダー]]に[[定数]]として送り込むには、
+
まず前提条件として[[シェーダー]]へ渡す[[変数]][[定数]])は[[ドローコール]]のたびに再設定するものであり、その変数(定数)は1回のドローコールが終わると自動的に消去される。
* Direct3D 9ではSetVertexShaderConstant命令とSetPixelShaderConstant命令を使って1個1個送り込んでいた。
 
* Direct3D 10からは定数バッファ(Constant Buffer、cbuffer)を使用してドスンと送信できるようになった。
 
  
まず、シェーダーへ渡す変数(定数)は[[ドローコール]]のたびに再設定するものである。
+
次に[[CPU]]側で動く[[プログラム]]の[[変数]]を[GPU]]側で動く[[プログラマブルシェーダー]]に[[定数]]として送り込むには、
変数(定数)は1回のドローコールが終わると自動消去される。
 
  
このためDirect3D 9では[[定数]]を描画の直前に毎回1個1個設定していた。
+
; Direct3D 9
描画のたびに[[メインメモリ]]から[[VRAM]]に小さな[[データ]]の転送を繰り返している感じである。
+
ドローコールの直前に毎回SetVertexShaderConstant命令やSetPixelShaderConstant命令を使って1個1個送り込んでいた。描画のたびに[[メインメモリ]]から[[VRAM]]に小さな[[データ]]の転送を繰り返していた。
  
一方、Direct3D 10も描画の直前に毎回設定するのは同じだが、定数バッファを1個設定するだけでよくなった。[[メインメモリ]]から[[VRAM]]に「定数バッファの[[ポインタ]]」だけが転送される感じである。つまり定数バッファを利用することで[[頂点バッファ]]や[[インデックスバッファ]]などと同様に再利用できるわけだ。
+
; Direct3D 10
 +
定数バッファ(Constant Buffer、cbuffer)を作成してGPU(VRAM)に送信しておき、以後はドローコールの直前にその定数バッファの[[ポインタ]]だけを送り込むようになった。
 +
 
 +
つまり定数バッファを利用することで[[頂点バッファ]]や[[インデックスバッファ]]などと同様に再利用でき、かつ毎回送信するデータもポインタひとつで済むようになった。
  
 
== 利点 ==
 
== 利点 ==

2022年6月9日 (木) 01:41時点における版

定数バッファ英語:Constant Buffer、通称:cbuffer)とは、CPUで動くプログラム変数群を、GPUで動くプログラマブルシェーダー定数群(バッファ)としてドスンと送り込む機構をいう。

OpenGL界隈では宗教上の理由により「Uniform Buffer Object」という方言が使われている。 意味はほぼ同じである。

概要

まず前提条件としてシェーダーへ渡す変数定数)はドローコールのたびに再設定するものであり、その変数(定数)は1回のドローコールが終わると自動的に消去される。

次にCPU側で動くプログラム変数を[GPU]]側で動くプログラマブルシェーダー定数として送り込むには、

Direct3D 9

ドローコールの直前に毎回SetVertexShaderConstant命令やSetPixelShaderConstant命令を使って1個1個送り込んでいた。描画のたびにメインメモリからVRAMに小さなデータの転送を繰り返していた。

Direct3D 10

定数バッファ(Constant Buffer、cbuffer)を作成してGPU(VRAM)に送信しておき、以後はドローコールの直前にその定数バッファのポインタだけを送り込むようになった。

つまり定数バッファを利用することで頂点バッファインデックスバッファなどと同様に再利用でき、かつ毎回送信するデータもポインタひとつで済むようになった。

利点

シェーダー定数には主にディレクショナルライトポイントライトの座標や明るさなどを格納していることが多い。これらはゲームシーンの中でそんなに勢いよく変化するものではない。ゲーム内で時間経過とともに「昼から夜に」「夜から昼に」なるものでもフレームレート単位でみたら変化などないに等しい。何千回、何万回というドローコールで1回変化するくらいのものである。

ならば定数は定数バッファとしてGPU内のVRAMに格納しておいて再利用すれば効率が良くなるということのようだ。

関連項目