最新版 |
編集中の文章 |
10行目: |
10行目: |
| | | |
| ; Direct3D 9 | | ; Direct3D 9 |
− | ドローコールの直前に毎回SetVertexShaderConstant命令やSetPixelShaderConstant命令を使って1個1個送り込んでいた。つまり1フレームを描画のたびに[[メインメモリ]]から[[VRAM]]に小さな[[データ]]の転送を繰り返していた。
| + | ドローコールの直前に毎回SetVertexShaderConstant命令やSetPixelShaderConstant命令を使って1個1個送り込んでいた。描画のたびに[[メインメモリ]]から[[VRAM]]に小さな[[データ]]の転送を繰り返していた。 |
| | | |
| ; Direct3D 10 | | ; Direct3D 10 |
22行目: |
22行目: |
| シェーダー定数で激しく変化する値といえば「カメラの位置」くらいである。 | | シェーダー定数で激しく変化する値といえば「カメラの位置」くらいである。 |
| ならば、その部分だけ書き換えて他の部分は再利用した方が効率が良い。 | | ならば、その部分だけ書き換えて他の部分は再利用した方が効率が良い。 |
− |
| |
− | == 注意:16バイトアライメント ==
| |
− |
| |
− | ほとんどのプラットフォームで「定数バッファの要素」は「16byteアライメント」となっています。
| |
− | 構造体のフィールド変数を上から順番に足したものが16バイト単位でなければなりません。
| |
− |
| |
− |
| |
− | ; 問題ない例
| |
− | <source lang="c">
| |
− | struct cb {
| |
− | float2 v1; // +8 = 8
| |
− | float2 v2; // +8 = 16
| |
− | }
| |
− | </source>
| |
− |
| |
− |
| |
− | ; ダメな例
| |
− | 以下は16バイトを超えているのでダメです。
| |
− | <source lang="c">
| |
− | struct cb {
| |
− | float3 v1; // +12 = 12
| |
− | float2 v2; // +8 = 20 (16を超えてるのでダメです)
| |
− | }
| |
− | </source>
| |
− |
| |
− | 上記のような場合は16バイト区切りになるようにダミー変数を挿入しましょう。
| |
− | <source lang="c">
| |
− | struct cb {
| |
− | float3 v1; // +12 = 12
| |
− | float _dummy1; // +4 = 16
| |
− |
| |
− | float2 v2; // +8 = 8
| |
− | float2 _dummy2; // +8 = 16
| |
− | }
| |
− | </source>
| |
− |
| |
− |
| |
− | === もっとも確実な解決策 ===
| |
− | もっとも簡単な解決方法は「すべて16バイトの float4 ( vec4 ) を使うこと」です。
| |
− |
| |
− | 数バイトが無駄だと思っても16バイトのfloat4で代用しましょう。
| |
− |
| |
− | 定数バッファがバカみたいに巨大化するようなことはまずなく、[[スマートウォッチ]]の[[SoC]]ですら初代[[プレイステーション]]より高性能で高速な今の時代、たった数十バイトで体感速度なんて変わりません。
| |
− |
| |
− | その数十バイトであらゆる悩みから解放されます。
| |
| | | |
| == 関連項目 == | | == 関連項目 == |