「AudioCraft」の版間の差分

提供: MonoBook
ナビゲーションに移動 検索に移動
17行目: 17行目:
  
 
== 動作環境 ==
 
== 動作環境 ==
* VRAM 16GB の GPU
+
; Python 3.9
*: AudioCraftで中規模の推論モデルを実行するためには少なくとも16GBの[[VRAM]]を持つ[[GPU]]を必要とします。
+
Python 3.10では動かないようです。
 +
Python 3.9にダウングレードしたら動きました。
  
まず[[ビデオカード]]の敷居が高い。
+
; VRAM 16GB の GPU
 +
AudioCraftで中規模の推論モデルを実行するためには少なくとも16GBの[[VRAM]]を持つ[[GPU]]を必要とします。まず[[ビデオカード]]の敷居が高い。
  
 
== 外部リンク ==
 
== 外部リンク ==

2023年8月15日 (火) 08:49時点における版

AudioCraftとは、2023年6月にMetafacebook)がオープンソースの下で公開した人工知能による音声に特化したPython向けのライブラリです。 PyTorchの上に構築されています。

学習と推論のサンプルコードが含まれています。 とくに推論については高品質な音楽を生成できるAudioGenとMusicGenという2つの推論モデルが同梱されています。

ライセンス

AudioGenやMusicGenで生成した音楽は非商用に限りYouTubeなどでも使用できます。 本モデルを使用していることを説明欄に明記し、かつ収益化してはならない(≒広告を入れてはならない)という点に注意してください。

動作環境

Python 3.9

Python 3.10では動かないようです。 Python 3.9にダウングレードしたら動きました。

VRAM 16GB の GPU

AudioCraftで中規模の推論モデルを実行するためには少なくとも16GBのVRAMを持つGPUを必要とします。まずビデオカードの敷居が高い。

外部リンク