メインメニューを開く

差分

定数バッファ

1,585 バイト追加, 2023年5月19日 (金) 01:59
== 概要 ==
まず前提条件として[[CPUシェーダー]]側で動く[[プログラム]]のへ渡す[[変数]]を、[[GPU定数]]側で動く)は[[プログラマブルシェーダー]]に[[定数ドローコール]]として送り込むには、* Direct3D 9ではSetVertexShaderConstant命令とSetPixelShaderConstant命令を使って1個1個送り込んでいた。* Direct3D 10からは定数バッファ(Constant Buffer、cbuffer)を使用してドスンと送信できるようになった。のたびに再設定するものであり、その変数(定数)は1回のドローコールが終わると自動的に消去される。
まず、シェーダーへ渡す変数(定数)は次に[[ドローコールCPU]]のたびに再設定するものである。変数(定数)は1回のドローコールが終わると自動消去される。側で動く[[プログラム]]の[[変数]]を[GPU]]側で動く[[プログラマブルシェーダー]]に[[定数]]として送り込むには、
このためDirect3D 9では[[定数]]を描画の直前に毎回1個1個設定していた。; Direct3D 9描画のたびにドローコールの直前に毎回SetVertexShaderConstant命令やSetPixelShaderConstant命令を使って1個1個送り込んでいた。つまり1フレームを描画のたびに[[メインメモリ]]から[[VRAM]]に小さな[[データ]]の転送を繰り返している感じである。の転送を繰り返していた。
一方、Direct3D 10も描画の直前に毎回設定するのは同じだが、定数バッファを1個設定するだけでよくなった。[[メインメモリ]]から[[; Direct3D 10定数バッファ(Constant Buffer、cbuffer)を作成してGPU(VRAM]]に「定数バッファの)に送信しておき、以後はドローコールの直前にその定数バッファの[[ポインタ]]」だけが転送される感じである。つまり定数バッファを利用することでだけを送り込むようになった。 つまり定数バッファを利用することで[[頂点バッファ]]や[[インデックスバッファ]]などと同様に再利用できるわけだ。などと同様に再利用でき、かつ毎回送信するデータもポインタひとつで済むようになった。
== 利点 ==
シェーダー定数には主に[[ディレクショナルライト]]や[[ポイントライト]]の座標や明るさなどを格納していることが多い。これらはゲームシーンの中でそんなに勢いよく変化するものではない。[[ゲーム]]内で時間経過とともに「昼から夜に」「夜から昼に」なるものでも[[フレームレート]]単位でみたら変化などないに等しい。何千回、何万回という[[ドローコール]]で1回変化するくらいのものである。で1回変化するくらいのものである。そもそも常に同じ天候や室内などの場合はほぼ変化がない。 シェーダー定数で激しく変化する値といえば「カメラの位置」くらいである。ならば、その部分だけ書き換えて他の部分は再利用した方が効率が良い。 == 注意:16バイトアライメント == ほとんどのプラットフォームで「定数バッファの要素」は「16byteアライメント」となっています。構造体のフィールド変数を上から順番に足したものが16バイト単位でなければなりません。  ; 問題ない例<source lang="c">struct cb { float2 v1; // +8 = 8 float2 v2; // +8 = 16}</source>  ; ダメな例以下は16バイトを超えているのでダメです。<source lang="c">struct cb { float3 v1; // +12 = 12 float2 v2; // +8 = 20 (16を超えてるのでダメです)}</source> 上記のような場合は16バイト区切りになるようにダミー変数を挿入しましょう。<source lang="c">struct cb { float3 v1; // +12 = 12 float _dummy1; // +4 = 16  float2 v2; // +8 = 8 float2 _dummy2; // +8 = 16}</source>  === もっとも確実な解決策 ===もっとも簡単な解決方法は「すべて16バイトの float4 ( vec4 ) を使うこと」です。 数バイトが無駄だと思っても16バイトのfloat4で代用しましょう。 定数バッファがバカみたいに巨大化するようなことはまずなく、[[スマートウォッチ]]の[[SoC]]ですら初代[[プレイステーション]]より高性能で高速な今の時代、たった数十バイトで体感速度なんて変わりません。
ならば定数は定数バッファとして[[GPU]]内の[[VRAM]]に格納しておいて再利用すれば効率が良くなるということのようだ。その数十バイトであらゆる悩みから解放されます。
== 関連項目 ==
[[category: 3DCG]]
[[category: シェーディング言語]]