「定数バッファ」の版間の差分

提供: MonoBook
ナビゲーションに移動 検索に移動
(ページの作成:「'''コンスタントバッファ'''(英語:Constant Buffer、通称:cbuffer)とは、CPUで動くプログラム変数群を、GPUで動…」)
 
 
(同じ利用者による、間の19版が非表示)
1行目: 1行目:
'''コンスタントバッファ'''([[英語]]:Constant Buffer、通称:cbuffer)とは、[[CPU]]で動く[[プログラム]]の[[変数]]群を、[[GPU]]で動く[[プログラマブルシェーダー]]に[[定数]]群としてドスンと送り込むバッファ、機構をいう。
+
'''定数バッファ'''([[英語]]:Constant Buffer、通称:cbuffer)とは、[[CPU]]で動く[[プログラム]]の[[変数]]群を、[[GPU]]で動く[[プログラマブルシェーダー]]に[[定数]]群(バッファ)としてドスンと送り込む機構をいう。
 +
 
 +
[[OpenGL]]界隈では宗教上の理由により「[[Uniform Buffer Object]]」という方言が使われている。
 +
意味はほぼ同じである。
  
 
== 概要 ==
 
== 概要 ==
[[CPU]]側で動く[[プログラム]]の[[変数]]を、[[GPU]]側で動く[[プログラマブルシェーダー]]に[[定数]]として送り込むには、
+
まず前提条件として[[シェーダー]]へ渡す[[変数]]([[定数]])は[[ドローコール]]のたびに再設定するものであり、その変数(定数)は1回のドローコールが終わると自動的に消去される。
* Direct3D 9ではSetVertexShaderConstantとSetPixelShaderConstantを使って1個1個送り込んでいた。
+
 
* Direct3D 10からはコンスタントバッファ(Constant Buffer、cbuffer)を使用してドスンと送信するようになった。
+
次に[[CPU]]側で動く[[プログラム]]の[[変数]][GPU]]側で動く[[プログラマブルシェーダー]]に[[定数]]として送り込むには、
 +
 
 +
; Direct3D 9
 +
ドローコールの直前に毎回SetVertexShaderConstant命令やSetPixelShaderConstant命令を使って1個1個送り込んでいた。つまり1フレームを描画のたびに[[メインメモリ]]から[[VRAM]]に小さな[[データ]]の転送を繰り返していた。
 +
 
 +
; Direct3D 10
 +
定数バッファ(Constant Buffer、cbuffer)を作成してGPU(VRAM)に送信しておき、以後はドローコールの直前にその定数バッファの[[ポインタ]]だけを送り込むようになった。
 +
 
 +
つまり定数バッファを利用することで[[頂点バッファ]]や[[インデックスバッファ]]などと同様に再利用でき、かつ毎回送信するデータもポインタひとつで済むようになった。
 +
 
 +
== 利点 ==
 +
シェーダー定数には主に[[ディレクショナルライト]]や[[ポイントライト]]の座標や明るさなどを格納していることが多い。これらはゲームシーンの中でそんなに勢いよく変化するものではない。[[ゲーム]]内で時間経過とともに「昼から夜に」「夜から昼に」なるものでも[[フレームレート]]単位でみたら変化などないに等しい。何千回、何万回という[[ドローコール]]で1回変化するくらいのものである。そもそも常に同じ天候や室内などの場合はほぼ変化がない。
 +
 
 +
シェーダー定数で激しく変化する値といえば「カメラの位置」くらいである。
 +
ならば、その部分だけ書き換えて他の部分は再利用した方が効率が良い。
 +
 
 +
== 注意:16バイトアライメント ==
 +
 
 +
ほとんどのプラットフォームで「定数バッファの要素」は「16byteアライメント」となっています。
 +
構造体のフィールド変数を上から順番に足したものが16バイト単位でなければなりません。
 +
 
 +
 
 +
; 問題ない例
 +
<source lang="c">
 +
struct cb {
 +
    float2 v1;      //  +8 = 8
 +
    float2 v2;      //  +8 = 16
 +
}
 +
</source>
 +
 
 +
 
 +
; ダメな例
 +
以下は16バイトを超えているのでダメです。
 +
<source lang="c">
 +
struct cb {
 +
    float3 v1;      // +12 = 12
 +
    float2 v2;      //  +8 = 20 (16を超えてるのでダメです)
 +
}
 +
</source>
 +
 
 +
上記のような場合は16バイト区切りになるようにダミー変数を挿入しましょう。
 +
<source lang="c">
 +
struct cb {
 +
    float3 v1;      // +12 = 12
 +
    float  _dummy1; //  +4 = 16
 +
 
 +
    float2 v2;      //  +8 = 8
 +
    float2 _dummy2; //  +8 = 16
 +
}
 +
</source>
 +
 
 +
 
 +
=== もっとも確実な解決策 ===
 +
もっとも簡単な解決方法は「すべて16バイトの float4 ( vec4 ) を使うこと」です。
 +
 
 +
数バイトが無駄だと思っても16バイトのfloat4で代用しましょう。
  
Direct3D 9では[[ドローコール]]の直前で毎回1個1個変数単位で設定していたが、
+
定数バッファがバカみたいに巨大化するようなことはまずなく、[[スマートウォッチ]][[SoC]]ですら初代[[プレイステーション]]より高性能で高速な今の時代、たった数十バイトで体感速度なんて変わりません。
Direct3D 10からはコンスタントバッファを1個設定するだけでよい。
 
つまり[[バーテックスバッファ]][[インデックスバッファ]]などと同様に再利用できるわけだ。
 
  
シェーダー定数には主に[[ディレクショナルライト]]や[[ポイントライト]]の座標や明るさなどを格納していることが多い。これらはゲームシーンの中でそんなに勢いよく変化するものではない。[[ゲーム]]内で時間経過とともに昼から夜に、夜から昼になるものでも[[フレームレート]]単位でみたら変化などないに等しい。何千回、何万回という[[ドローコール]]で1回変化するくらいのものである。
+
その数十バイトであらゆる悩みから解放されます。
ならば定数はコンスタントバッファとして[[GPU]]内の[[VRAM]]に格納しておいて再利用すれば効率が良くなるということのようだ。
 
  
 
== 関連項目 ==
 
== 関連項目 ==
17行目: 72行目:
 
* [[バーテックスバッファ]]([[頂点バッファ]])
 
* [[バーテックスバッファ]]([[頂点バッファ]])
 
* [[インデックスバッファ]]
 
* [[インデックスバッファ]]
* [[コンスタントバッファ]]
+
* [[コンスタントバッファ]]([[定数バッファ]])
 
* [[三角形の秘密についてリークする]]
 
* [[三角形の秘密についてリークする]]
  
 
[[category: 3DCG]]
 
[[category: 3DCG]]
 +
[[category: シェーディング言語]]

2023年5月19日 (金) 01:59時点における最新版

定数バッファ英語:Constant Buffer、通称:cbuffer)とは、CPUで動くプログラム変数群を、GPUで動くプログラマブルシェーダー定数群(バッファ)としてドスンと送り込む機構をいう。

OpenGL界隈では宗教上の理由により「Uniform Buffer Object」という方言が使われている。 意味はほぼ同じである。

概要[編集 | ソースを編集]

まず前提条件としてシェーダーへ渡す変数定数)はドローコールのたびに再設定するものであり、その変数(定数)は1回のドローコールが終わると自動的に消去される。

次にCPU側で動くプログラム変数を[GPU]]側で動くプログラマブルシェーダー定数として送り込むには、

Direct3D 9

ドローコールの直前に毎回SetVertexShaderConstant命令やSetPixelShaderConstant命令を使って1個1個送り込んでいた。つまり1フレームを描画のたびにメインメモリからVRAMに小さなデータの転送を繰り返していた。

Direct3D 10

定数バッファ(Constant Buffer、cbuffer)を作成してGPU(VRAM)に送信しておき、以後はドローコールの直前にその定数バッファのポインタだけを送り込むようになった。

つまり定数バッファを利用することで頂点バッファインデックスバッファなどと同様に再利用でき、かつ毎回送信するデータもポインタひとつで済むようになった。

利点[編集 | ソースを編集]

シェーダー定数には主にディレクショナルライトポイントライトの座標や明るさなどを格納していることが多い。これらはゲームシーンの中でそんなに勢いよく変化するものではない。ゲーム内で時間経過とともに「昼から夜に」「夜から昼に」なるものでもフレームレート単位でみたら変化などないに等しい。何千回、何万回というドローコールで1回変化するくらいのものである。そもそも常に同じ天候や室内などの場合はほぼ変化がない。

シェーダー定数で激しく変化する値といえば「カメラの位置」くらいである。 ならば、その部分だけ書き換えて他の部分は再利用した方が効率が良い。

注意:16バイトアライメント[編集 | ソースを編集]

ほとんどのプラットフォームで「定数バッファの要素」は「16byteアライメント」となっています。 構造体のフィールド変数を上から順番に足したものが16バイト単位でなければなりません。


問題ない例
struct cb {
    float2 v1;      //  +8 = 8
    float2 v2;      //  +8 = 16
}


ダメな例

以下は16バイトを超えているのでダメです。

struct cb {
    float3 v1;      // +12 = 12
    float2 v2;      //  +8 = 20 (16を超えてるのでダメです)
}

上記のような場合は16バイト区切りになるようにダミー変数を挿入しましょう。

struct cb {
    float3 v1;      // +12 = 12
    float  _dummy1; //  +4 = 16

    float2 v2;      //  +8 = 8
    float2 _dummy2; //  +8 = 16
}


もっとも確実な解決策[編集 | ソースを編集]

もっとも簡単な解決方法は「すべて16バイトの float4 ( vec4 ) を使うこと」です。

数バイトが無駄だと思っても16バイトのfloat4で代用しましょう。

定数バッファがバカみたいに巨大化するようなことはまずなく、スマートウォッチSoCですら初代プレイステーションより高性能で高速な今の時代、たった数十バイトで体感速度なんて変わりません。

その数十バイトであらゆる悩みから解放されます。

関連項目[編集 | ソースを編集]