AudioCraft
AudioCraftとは、2023年6月にMeta(facebook)がオープンソースの下で公開した人工知能による音声に特化したPython向けのライブラリです。 PyTorchの上に構築されています。
学習と推論のサンプルコードが含まれています。 とくに推論については高品質な音楽を生成できるAudioGenとMusicGenという2つの推論モデルが同梱されています。
ライセンス
AudioGenやMusicGenで生成した音楽は非商用に限りYouTubeなどでも使用できます。 本モデルを使用していることを説明欄に明記し、かつ収益化してはならない(≒広告を入れてはならない)という点に注意してください。
- 個々の動画で広告表示を無効にする方法
動作環境
- Python 3.9
Python 3.10では動かないようです。 Python 3.9にダウングレードしたら動きました。
- VRAM 16GB の GPU
AudioCraftで中規模の推論モデルを実行するためには少なくとも16GBのVRAMを持つGPUを必要とします。まずビデオカードの敷居が高い。