「Wan 2.2」の版間の差分

編集の要約なし
 
(同じ利用者による、間の4版が非表示)
2行目: 2行目:


== 特徴 ==
== 特徴 ==
Wan2.2は、先行モデルであるWan2.1を大幅に拡張・改良している。単なるマイナーバージョンアップではなく、内部アーキテクチャやデータセットの規模が刷新されている点が特徴である。
Wan2.2は、先行モデルである[[Wan2.1]]を大幅に拡張・改良している。バージョン番号は0.1しか増えていませんが単なるマイナーバージョンアップではなく、内部アーキテクチャやデータセットの規模が刷新されている点が特徴です。


* Mixture-of-Experts(MoE)による効率的な推論
=== Mixture of Experts(MoE)による効率的な推論 ===
  Wan2.2は「専門家モデル」を切り替える仕組みを持ち、入力の特徴に応じて最適なネットワークを活用する。そのため、実際に推論で使用する計算資源は14B規模でありながら、学習には約270億のパラメータを用いている。この仕組みにより、従来よりも高速かつ高精度な生成が可能となった。
Wan2.2は「[[Mixture of Experts]](MoE)」と呼ばれる「専門家モデル」を切り替える仕組みを持ち、入力の特徴に応じて最適なネットワークを活用する。そのため、実際に推論で使用する計算資源は14B規模でありながら、学習には約270億のパラメータを用いている。この仕組みにより、従来よりも高速かつ高精度な生成が可能となった。


* 大規模データセットによる表現力向上
=== 大規模データセットによる表現力向上 ===
  学習に用いられた画像と動画の規模は、前バージョンよりも数十%単位で増加している。これによりキャラクターの自然な動きやシネマティックなライティング表現の再現性が高まり、生身のカメラ映像に近い仕上がりが得やすくなっている。
学習に用いられた画像と動画の規模は、前バージョンよりも数十%単位で増加している。これによりキャラクターの自然な動きやシネマティックなライティング表現の再現性が高まり、生身のカメラ映像に近い仕上がりが得やすくなっている。


* 高解像度動画の生成
=== 高解像度動画の生成 ===
  コンシューマーGPUでも720p・24fpsの動画を安定的に生成できる点は、実用性の大きな進歩である。さらに、十分なVRAMと高性能GPUでは1080p出力も可能とされ、短編映像制作にも利用できる。
コンシューマーGPUでも720p・24fpsの動画を安定的に生成できる点は、実用性の大きな進歩である。さらに、十分なVRAMと高性能GPUでは1080p出力も可能とされ、短編映像制作にも利用できる。


* 制御性と表現の柔軟性
=== 制御性と表現の柔軟性 ===
  テキストやプロンプトを通じてカメラの構図やライティング条件、色調などをきめ細かく指定できるため、単なる自動生成ではなくクリエイティブな制作支援ツールとしての性格を持っている。
テキストやプロンプトを通じてカメラの構図やライティング条件、色調などをきめ細かく指定できるため、単なる自動生成ではなくクリエイティブな制作支援ツールとしての性格を持っている。


== Wan2.1との主な違い ==
== Wan2.1との主な違い ==
71行目: 71行目:
* [[生成AI]]
* [[生成AI]]


[[カテゴリ:動画生成AI]]
[[カテゴリ:Wan 2.2]]
[[カテゴリ:アリババ]]