Wan 2.2
Wan2.1との主な違い
Wan2.1の後継品です。バージョンは0.1しか上がっていませんが完全に別物らしいです。
- アーキテクチャと性能向上:Wan2.2はMixture-of-Experts(MoE)アーキテクチャを採用し、高ノイズ・低ノイズの段階で異なる専門家(エキスパート)を切り替えることで、より効率的な学習と生成を実現しています。これにより、パラメータは約270億と大規模ながらも、推論時には約14B程度の計算資源で動作可能です。
- 学習データの拡大:学習に用いる画像や動画を65.6%・83.2%増やし、映画的美学や動きの精度を大幅に改善し、より自然で高品質な動画生成が可能になっています。
- 生成解像度と速度:720p@24fpsの高解像度動画生成をサポートし、コンシューマーGPU(例:NVIDIA RTX 4090)でも高速に動作します。
- 映画的美学と制御性:ライティングや構図の細部表現、色調調整などのコントロールも強化されています。
主なモデル
| モデル名 | 推奨VRAM容量 | 生成可能な動画解像度 | |
|---|---|---|---|
| Animate-14B | 24GB以上 | 720p程度 | |
| S2V-14B | 24GB以上 | 720p程度 | |
| TI2V-5B | 10GB以上 | 512×384くらい | |
| I2V-A14B | 24GB以上 | 720p程度 | |
| T2V-A14B | 24GB以上 | 720p程度 |
I2V-A14BとT2V-A14BであればGeForce RTX 4090があれば動かせます。ただし24GBの場合は720p程度が限界です。VRAM盛り盛りなら1080pもいけるようです。
生のフルモデルはA100やH100が必須です。Ryzen AI Max+ 395で動くかはまだ試していませんが、前作のWan2.1は動いたのでたぶん動くと思います。