最新版 |
編集中の文章 |
1行目: |
1行目: |
− | '''定数バッファ'''([[英語]]:Constant Buffer、通称:cbuffer)とは、[[CPU]]で動く[[プログラム]]の[[変数]]群を、[[GPU]]で動く[[プログラマブルシェーダー]]に[[定数]]群(バッファ)としてドスンと送り込む機構をいう。 | + | '''コンスタントバッファ'''([[英語]]:Constant Buffer、通称:cbuffer)とは、[[CPU]]で動く[[プログラム]]の[[変数]]群を、[[GPU]]で動く[[プログラマブルシェーダー]]に[[定数]]群としてドスンと送り込むバッファ、機構をいう。 |
| | | |
− | [[OpenGL]]界隈では宗教上の理由により「[[Uniform Buffer Object]]」という方言が使われている。 | + | [[OpenGL]]界隈では「[[Uniform Buffer Object]]」という方言が使われている。意味はほぼ同じである。 |
− | 意味はほぼ同じである。
| |
| | | |
| == 概要 == | | == 概要 == |
− | まず前提条件として[[シェーダー]]へ渡す[[変数]]([[定数]])は[[ドローコール]]のたびに再設定するものであり、その変数(定数)は1回のドローコールが終わると自動的に消去される。
| + | [[CPU]]側で動く[[プログラム]]の[[変数]]を、[[GPU]]側で動く[[プログラマブルシェーダー]]に[[定数]]として送り込むには、 |
| + | * Direct3D 9ではSetVertexShaderConstantとSetPixelShaderConstantを使って1個1個送り込んでいた。 |
| + | * Direct3D 10からはコンスタントバッファ(Constant Buffer、cbuffer)を使用してドスンと送信するようになった。 |
| | | |
− | 次に[[CPU]]側で動く[[プログラム]]の[[変数]]を[GPU]]側で動く[[プログラマブルシェーダー]]に[[定数]]として送り込むには、
| + | Direct3D 9では[[ドローコール]]の直前で毎回1個1個変数単位で設定していたが、 |
| + | Direct3D 10からはコンスタントバッファを1個設定するだけでよい。 |
| + | つまり[[バーテックスバッファ]]や[[インデックスバッファ]]などと同様に再利用できるわけだ。 |
| | | |
− | ; Direct3D 9
| + | シェーダー定数には主に[[ディレクショナルライト]]や[[ポイントライト]]の座標や明るさなどを格納していることが多い。これらはゲームシーンの中でそんなに勢いよく変化するものではない。[[ゲーム]]内で時間経過とともに昼から夜に、夜から昼になるものでも[[フレームレート]]単位でみたら変化などないに等しい。何千回、何万回という[[ドローコール]]で1回変化するくらいのものである。 |
− | ドローコールの直前に毎回SetVertexShaderConstant命令やSetPixelShaderConstant命令を使って1個1個送り込んでいた。つまり1フレームを描画のたびに[[メインメモリ]]から[[VRAM]]に小さな[[データ]]の転送を繰り返していた。
| + | ならば定数はコンスタントバッファとして[[GPU]]内の[[VRAM]]に格納しておいて再利用すれば効率が良くなるということのようだ。 |
− | | |
− | ; Direct3D 10
| |
− | 定数バッファ(Constant Buffer、cbuffer)を作成してGPU(VRAM)に送信しておき、以後はドローコールの直前にその定数バッファの[[ポインタ]]だけを送り込むようになった。
| |
− | | |
− | つまり定数バッファを利用することで[[頂点バッファ]]や[[インデックスバッファ]]などと同様に再利用でき、かつ毎回送信するデータもポインタひとつで済むようになった。
| |
− | | |
− | == 利点 ==
| |
− | シェーダー定数には主に[[ディレクショナルライト]]や[[ポイントライト]]の座標や明るさなどを格納していることが多い。これらはゲームシーンの中でそんなに勢いよく変化するものではない。[[ゲーム]]内で時間経過とともに「昼から夜に」「夜から昼に」なるものでも[[フレームレート]]単位でみたら変化などないに等しい。何千回、何万回という[[ドローコール]]で1回変化するくらいのものである。そもそも常に同じ天候や室内などの場合はほぼ変化がない。 | |
− | | |
− | シェーダー定数で激しく変化する値といえば「カメラの位置」くらいである。
| |
− | ならば、その部分だけ書き換えて他の部分は再利用した方が効率が良い。
| |
− | | |
− | == 注意:16バイトアライメント ==
| |
− | | |
− | ほとんどのプラットフォームで「定数バッファの要素」は「16byteアライメント」となっています。
| |
− | 構造体のフィールド変数を上から順番に足したものが16バイト単位でなければなりません。
| |
− | | |
− | | |
− | ; 問題ない例
| |
− | <source lang="c">
| |
− | struct cb {
| |
− | float2 v1; // +8 = 8
| |
− | float2 v2; // +8 = 16
| |
− | }
| |
− | </source>
| |
− | | |
− | | |
− | ; ダメな例
| |
− | 以下は16バイトを超えているのでダメです。
| |
− | <source lang="c">
| |
− | struct cb {
| |
− | float3 v1; // +12 = 12
| |
− | float2 v2; // +8 = 20 (16を超えてるのでダメです)
| |
− | }
| |
− | </source>
| |
− | | |
− | 上記のような場合は16バイト区切りになるようにダミー変数を挿入しましょう。
| |
− | <source lang="c">
| |
− | struct cb {
| |
− | float3 v1; // +12 = 12
| |
− | float _dummy1; // +4 = 16
| |
− | | |
− | float2 v2; // +8 = 8
| |
− | float2 _dummy2; // +8 = 16
| |
− | }
| |
− | </source>
| |
− | | |
− | | |
− | === もっとも確実な解決策 ===
| |
− | もっとも簡単な解決方法は「すべて16バイトの float4 ( vec4 ) を使うこと」です。
| |
− | | |
− | 数バイトが無駄だと思っても16バイトのfloat4で代用しましょう。
| |
− | | |
− | 定数バッファがバカみたいに巨大化するようなことはまずなく、[[スマートウォッチ]]の[[SoC]]ですら初代[[プレイステーション]]より高性能で高速な今の時代、たった数十バイトで体感速度なんて変わりません。
| |
− | | |
− | その数十バイトであらゆる悩みから解放されます。
| |
| | | |
| == 関連項目 == | | == 関連項目 == |
72行目: |
19行目: |
| * [[バーテックスバッファ]]([[頂点バッファ]]) | | * [[バーテックスバッファ]]([[頂点バッファ]]) |
| * [[インデックスバッファ]] | | * [[インデックスバッファ]] |
− | * [[コンスタントバッファ]]([[定数バッファ]]) | + | * [[コンスタントバッファ]] |
| * [[三角形の秘密についてリークする]] | | * [[三角形の秘密についてリークする]] |
| | | |
| [[category: 3DCG]] | | [[category: 3DCG]] |
− | [[category: シェーディング言語]]
| |