「Wan 2.2」の版間の差分

4行目:

Wan2.2は、先行モデルであるWan2.1を大幅に拡張・改良している。単なるマイナーバージョンアップではなく、内部アーキテクチャやデータセットの規模が刷新されている点が特徴である。

* Mixture-of-Experts（MoE）による効率的な推論

=== Mixture-of-Experts（MoE）による効率的な推論 ===

Wan2.2は「専門家モデル」を切り替える仕組みを持ち、入力の特徴に応じて最適なネットワークを活用する。そのため、実際に推論で使用する計算資源は14B規模でありながら、学習には約270億のパラメータを用いている。この仕組みにより、従来よりも高速かつ高精度な生成が可能となった。

* 大規模データセットによる表現力向上

=== 大規模データセットによる表現力向上 ===

学習に用いられた画像と動画の規模は、前バージョンよりも数十％単位で増加している。これによりキャラクターの自然な動きやシネマティックなライティング表現の再現性が高まり、生身のカメラ映像に近い仕上がりが得やすくなっている。

* 高解像度動画の生成

=== 高解像度動画の生成 ===

コンシューマーGPUでも720p・24fpsの動画を安定的に生成できる点は、実用性の大きな進歩である。さらに、十分なVRAMと高性能GPUでは1080p出力も可能とされ、短編映像制作にも利用できる。

* 制御性と表現の柔軟性

=== 制御性と表現の柔軟性 ===

テキストやプロンプトを通じてカメラの構図やライティング条件、色調などをきめ細かく指定できるため、単なる自動生成ではなくクリエイティブな制作支援ツールとしての性格を持っている。

== Wan2.1との主な違い ==

@@ 4行目: / 4行目: @@
 Wan2.2は、先行モデルであるWan2.1を大幅に拡張・改良している。単なるマイナーバージョンアップではなく、内部アーキテクチャやデータセットの規模が刷新されている点が特徴である。
-* Mixture-of-Experts（MoE）による効率的な推論
+=== Mixture-of-Experts（MoE）による効率的な推論 ===
-  Wan2.2は「専門家モデル」を切り替える仕組みを持ち、入力の特徴に応じて最適なネットワークを活用する。そのため、実際に推論で使用する計算資源は14B規模でありながら、学習には約270億のパラメータを用いている。この仕組みにより、従来よりも高速かつ高精度な生成が可能となった。
+Wan2.2は「専門家モデル」を切り替える仕組みを持ち、入力の特徴に応じて最適なネットワークを活用する。そのため、実際に推論で使用する計算資源は14B規模でありながら、学習には約270億のパラメータを用いている。この仕組みにより、従来よりも高速かつ高精度な生成が可能となった。
-* 大規模データセットによる表現力向上
+=== 大規模データセットによる表現力向上 ===
-  学習に用いられた画像と動画の規模は、前バージョンよりも数十％単位で増加している。これによりキャラクターの自然な動きやシネマティックなライティング表現の再現性が高まり、生身のカメラ映像に近い仕上がりが得やすくなっている。
+学習に用いられた画像と動画の規模は、前バージョンよりも数十％単位で増加している。これによりキャラクターの自然な動きやシネマティックなライティング表現の再現性が高まり、生身のカメラ映像に近い仕上がりが得やすくなっている。
-* 高解像度動画の生成
+=== 高解像度動画の生成 ===
-  コンシューマーGPUでも720p・24fpsの動画を安定的に生成できる点は、実用性の大きな進歩である。さらに、十分なVRAMと高性能GPUでは1080p出力も可能とされ、短編映像制作にも利用できる。
+コンシューマーGPUでも720p・24fpsの動画を安定的に生成できる点は、実用性の大きな進歩である。さらに、十分なVRAMと高性能GPUでは1080p出力も可能とされ、短編映像制作にも利用できる。
-* 制御性と表現の柔軟性
+=== 制御性と表現の柔軟性 ===
-  テキストやプロンプトを通じてカメラの構図やライティング条件、色調などをきめ細かく指定できるため、単なる自動生成ではなくクリエイティブな制作支援ツールとしての性格を持っている。
+テキストやプロンプトを通じてカメラの構図やライティング条件、色調などをきめ細かく指定できるため、単なる自動生成ではなくクリエイティブな制作支援ツールとしての性格を持っている。
 == Wan2.1との主な違い ==