「AudioCraft」の版間の差分

2023年8月15日 (火) 08:49時点における版

AudioCraftとは、2023年6月にMeta（facebook）がオープンソースの下で公開した人工知能による音声に特化したPython向けのライブラリです。 PyTorchの上に構築されています。

学習と推論のサンプルコードが含まれています。とくに推論については高品質な音楽を生成できるAudioGenとMusicGenという2つの推論モデルが同梱されています。

AudioGenやMusicGenで生成した音楽は非商用に限りYouTubeなどでも使用できます。本モデルを使用していることを説明欄に明記し、かつ収益化してはならない（≒広告を入れてはならない）という点に注意してください。

Python 3.10では動かないようです。 Python 3.9にダウングレードしたら動きました。

AudioCraftで中規模の推論モデルを実行するためには少なくとも16GBのVRAMを持つGPUを必要とします。まずビデオカードの敷居が高い。

@@ 17行目: / 17行目: @@
 == 動作環境 ==
-* VRAM 16GB の GPU
+; Python 3.9
-*: AudioCraftで中規模の推論モデルを実行するためには少なくとも16GBの[[VRAM]]を持つ[[GPU]]を必要とします。
+Python 3.10では動かないようです。
+Python 3.9にダウングレードしたら動きました。
-まず[[ビデオカード]]の敷居が高い。
+; VRAM 16GB の GPU
+AudioCraftで中規模の推論モデルを実行するためには少なくとも16GBの[[VRAM]]を持つ[[GPU]]を必要とします。まず[[ビデオカード]]の敷居が高い。
 == 外部リンク ==