コンテンツにスキップ
メインメニュー
メインメニュー
サイドバーに移動
非表示
案内
メインページ
最近の更新
未作成ページ
おまかせ表示
ヘルプ
MonoBook
検索
検索
ログイン
個人用ツール
ログイン
ログアウトした編集者のページ
もっと詳しく
投稿記録
トーク
「
AudioCraft
」を編集中
ページ
議論
日本語
閲覧
編集
ソースを編集
履歴表示
ツール
ツール
サイドバーに移動
非表示
操作
閲覧
編集
ソースを編集
履歴表示
全般
リンク元
関連ページの更新状況
特別ページ
ページ情報
警告:
ログインしていません。編集を行うと、あなたの IP アドレスが公開されます。
ログイン
または
アカウントを作成
すれば、あなたの編集はその利用者名とともに表示されるほか、その他の利点もあります。
スパム攻撃防止用のチェックです。 けっして、ここには、値の入力は
しない
でください!
'''AudioCraft'''とは、2023年6月に[[Meta]]([[facebook]])が[[オープンソース]]の下で公開した[[人工知能]]による音声に特化した[[Python]]向けの[[ライブラリ]]です。 [[PyTorch]]の上に構築されています。 AudioCraftには学習と[[推論]]のサンプルコードが含まれています。とくに推論については高品質な音楽を生成できるAudioGenとMusicGenという2つの推論モデルが同梱されています。 == ライセンス == * ソースコードは[[MITライセンス]] * 付属の推論モデルは[[CC-BY-NC 4.0]] *: https://creativecommons.org/licenses/by-nc/4.0/deed.ja AudioGenやMusicGenで生成した音楽は非商用に限り[[YouTube]]などでも使用できます。 本モデルを使用していることを説明欄に明記し、かつ収益化してはならない(≒広告を入れてはならない)という点に注意してください。 *個々の動画で広告表示を無効にする方法 *: https://support.google.com/youtube/answer/6332943?hl=ja == 動作環境 == ; Python 3.9 Python 3.10では動かないようです。 Python 3.9にダウングレードしたら動きました。 ; VRAM 16GB の GPU まず[[ビデオカード]]の敷居が高い。AudioCraftで中規模の推論モデルを実行するためには少なくとも16GBの[[VRAM]]を持つ[[GPU]]を必要とします。 軽く試した感じでは時間30秒に設定した mediumモデルでVRAM使用量は11GB前後となっています。やはりVRAM12GBのビデオカードではかなり厳しいと思われます。 速度を求めないなら[[メインメモリ]]が多めの[[Ryzen APU]]か[[Mac]] ([[Apple Silicon]])を使用するのが手軽かと思います。 == 外部リンク == * https://github.com/facebookresearch/audiocraft [[category: 人工知能]]
編集内容の要約:
MonoBookへの投稿はすべて、他の投稿者によって編集、変更、除去される場合があります。 自分が書いたものが他の人に容赦なく編集されるのを望まない場合は、ここに投稿しないでください。
また、投稿するのは、自分で書いたものか、パブリック ドメインまたはそれに類するフリーな資料からの複製であることを約束してください(詳細は
MonoBook:著作権
を参照)。
著作権保護されている作品は、許諾なしに投稿しないでください!
このページを編集するには、下記の確認用の質問に回答してください (
詳細
):
1たす1は?(全角で入力してください)
キャンセル
編集の仕方
(新しいウィンドウで開きます)
本文の横幅制限を有効化/無効化