「定数バッファ」の版間の差分

編集の要約なし
 
(同じ利用者による、間の12版が非表示)
10行目: 10行目:


; Direct3D 9
; Direct3D 9
ドローコールの直前に毎回SetVertexShaderConstant命令やSetPixelShaderConstant命令を使って1個1個送り込んでいた。描画のたびに[[メインメモリ]]から[[VRAM]]に小さな[[データ]]の転送を繰り返していた。
ドローコールの直前に毎回SetVertexShaderConstant命令やSetPixelShaderConstant命令を使って1個1個送り込んでいた。つまり1フレームを描画のたびに[[メインメモリ]]から[[VRAM]]に小さな[[データ]]の転送を繰り返していた。


; Direct3D 10
; Direct3D 10
18行目: 18行目:


== 利点 ==
== 利点 ==
シェーダー定数には主に[[ディレクショナルライト]]や[[ポイントライト]]の座標や明るさなどを格納していることが多い。これらはゲームシーンの中でそんなに勢いよく変化するものではない。[[ゲーム]]内で時間経過とともに「昼から夜に」「夜から昼に」なるものでも[[フレームレート]]単位でみたら変化などないに等しい。何千回、何万回という[[ドローコール]]で1回変化するくらいのものである。
シェーダー定数には主に[[ディレクショナルライト]]や[[ポイントライト]]の座標や明るさなどを格納していることが多い。これらはゲームシーンの中でそんなに勢いよく変化するものではない。[[ゲーム]]内で時間経過とともに「昼から夜に」「夜から昼に」なるものでも[[フレームレート]]単位でみたら変化などないに等しい。何千回、何万回という[[ドローコール]]で1回変化するくらいのものである。そもそも常に同じ天候や室内などの場合はほぼ変化がない。


ならば定数は定数バッファとして[[GPU]]内の[[VRAM]]に格納しておいて再利用すれば効率が良くなるということのようだ。
シェーダー定数で激しく変化する値といえば「カメラの位置」くらいである。
ならば、その部分だけ書き換えて他の部分は再利用した方が効率が良い。
 
== 注意:16バイトアライメント ==
 
ほとんどのプラットフォームで「定数バッファの要素」は「16byteアライメント」となっています。
構造体のフィールド変数を上から順番に足したものが16バイト単位でなければなりません。
 
 
; 問題ない例
<source lang="c">
struct cb {
    float2 v1;      //  +8 = 8
    float2 v2;      //  +8 = 16
}
</source>
 
 
; ダメな例
以下は16バイトを超えているのでダメです。
<source lang="c">
struct cb {
    float3 v1;      // +12 = 12
    float2 v2;      //  +8 = 20 (16を超えてるのでダメです)
}
</source>
 
上記のような場合は16バイト区切りになるようにダミー変数を挿入しましょう。
<source lang="c">
struct cb {
    float3 v1;      // +12 = 12
    float  _dummy1; //  +4 = 16
 
    float2 v2;      //  +8 = 8
    float2 _dummy2; //  +8 = 16
}
</source>
 
 
=== もっとも確実な解決策 ===
もっとも簡単な解決方法は「すべて16バイトの float4 ( vec4 ) を使うこと」です。
 
数バイトが無駄だと思っても16バイトのfloat4で代用しましょう。
 
定数バッファがバカみたいに巨大化するようなことはまずなく、[[スマートウォッチ]][[SoC]]ですら初代[[プレイステーション]]より高性能で高速な今の時代、たった数十バイトで体感速度なんて変わりません。
 
その数十バイトであらゆる悩みから解放されます。


== 関連項目 ==
== 関連項目 ==
31行目: 77行目:
[[category: 3DCG]]
[[category: 3DCG]]
[[category: シェーディング言語]]
[[category: シェーディング言語]]
[[category: HLSL]]