差分

← 古い編集

AudioCraft

772 バイト追加, 2023年8月21日 (月) 23:18

[[PyTorch]]の上に構築されています。

~~学習と推論のサンプルコードが含まれています。とくに推論については高品質な音楽を生成できるAudioGenとMusicGenという2つの推論モデルが同梱されています。~~AudioCraftには学習と推論のサンプルコードが含まれています。とくに推論については高品質な音楽を生成できるAudioGenとMusicGenという2つの推論モデルが同梱されています。

== ライセンス ==

*: https://creativecommons.org/licenses/by-nc/4.0/deed.ja

~~AudioGenやMusicGenで生成した音楽は~~AudioGenやMusicGenで生成した音楽は非商用に限り[[YouTube]]などでも使用できます。~~ただし、本モデルを使用していることを説明欄に明記し、かつ収益化してはならないという点に注意してください。~~本モデルを使用していることを説明欄に明記し、かつ収益化してはならない（≒広告を入れてはならない）という点に注意してください。

*個々の動画で広告表示を無効にする方法

*: https://support.google.com/youtube/answer/6332943?hl=ja

== 動作環境 ==

; Python 3.9

Python 3.10では動かないようです。

Python 3.9にダウングレードしたら動きました。

; VRAM 16GB の GPU

まず[[ビデオカード]]の敷居が高い。AudioCraftで中規模の推論モデルを実行するためには少なくとも16GBの[[VRAM]]を持つ[[GPU]]を必要とします。

軽く試した感じでは時間30秒に設定した mediumモデルでVRAM使用量は11GB前後となっています。やはりVRAM12GBのビデオカードではかなり厳しいと思われます。

速度を求めないなら[[メインメモリ]]が多めの[[Ryzen APU]]か[[Mac]] ([[Apple Silicon]])を使用するのが手軽かと思います。

== 外部リンク ==

Administrator

ビューロクラット、インターフェース管理者、管理者

8,238

回編集