コンテンツにスキップ
メインメニュー
メインメニュー
サイドバーに移動
非表示
案内
メインページ
最近の更新
未作成ページ
おまかせ表示
ヘルプ
MonoBook
検索
検索
ログイン
個人用ツール
ログイン
ログアウトした編集者のページ
もっと詳しく
投稿記録
トーク
「
HunyuanVideo
」を編集中
ページ
議論
日本語
閲覧
編集
ソースを編集
履歴表示
ツール
ツール
サイドバーに移動
非表示
操作
閲覧
編集
ソースを編集
履歴表示
全般
リンク元
関連ページの更新状況
特別ページ
ページ情報
警告:
ログインしていません。編集を行うと、あなたの IP アドレスが公開されます。
ログイン
または
アカウントを作成
すれば、あなたの編集はその利用者名とともに表示されるほか、その他の利点もあります。
スパム攻撃防止用のチェックです。 けっして、ここには、値の入力は
しない
でください!
'''HunyuanVideo'''とは、中国の[[テンセント]]([[Tencent]])が開発し公開した[[オープンソース]]の[[AI動画生成モデル]]です。 テキストプロンプトから高品質でリアルな動画を生成することができ、多数のパラメータをもちながら物理法則を考慮した自然な動きや表情を再現する。 3D VAEやマルチモーダルLLM(大規模多モーダル言語モデル)を活用し、画像と動画の統合型アーキテクチャによって映像の質と意味の整合性を高めている。 == 特徴 == === マルチモーダルLLMによる高品質生成 === テキストプロンプトを大規模言語モデルでエンコードし、その条件を使って潜在空間で時空間的特徴を学習・生成。これにより、意味的にも視覚的にも優れた動画を作成する。 === 統合型画像・動画生成アーキテクチャ === 動画とテキストの情報をデュアルストリームで別々に処理後、シングルストリームで融合するハイブリッドTransformer設計により、映像と言語の複雑な相互作用を効果的に扱う。 === 進化した3D VAEによる高圧縮率 === CausalConv3Dを用いた3D変分オートエンコーダで動画データを潜在空間に圧縮し、高解像度・高フレームレートを維持しながら効率的な学習と生成を実現。 === 物理法則を考慮したリアリティ === 映像の質は非常に高く、動きの一貫性や表情の自然さが優れている。シーン遷移やカメラワークもシームレスで、観る者に違和感を与えにくい。 === 商用利用が可能 === オープンソースでありながら商用利用も許可されており、マーケティング動画や広告などの分野での活用も期待されている。 == 主要なモデルと推奨動作環境 == 調査中 == 応用例 == * 教育やマーケティング用の高品質動画自動生成 * 映像制作の事前ビジュアライゼーション * ゲームやアニメーションの素材制作 * 研究や実験での合成映像作成 == 関連項目 == * [[動画生成AI]] * [[Tencent]] * [[大規模言語モデル]] * [[3D VAE]] [[カテゴリ:動画生成AI]] [[カテゴリ:Tencent]]
編集内容の要約:
MonoBookへの投稿はすべて、他の投稿者によって編集、変更、除去される場合があります。 自分が書いたものが他の人に容赦なく編集されるのを望まない場合は、ここに投稿しないでください。
また、投稿するのは、自分で書いたものか、パブリック ドメインまたはそれに類するフリーな資料からの複製であることを約束してください(詳細は
MonoBook:著作権
を参照)。
著作権保護されている作品は、許諾なしに投稿しないでください!
このページを編集するには、下記の確認用の質問に回答してください (
詳細
):
1たす1は?(全角で入力してください)
キャンセル
編集の仕方
(新しいウィンドウで開きます)
本文の横幅制限を有効化/無効化