「AudioCraft」の版間の差分

(同じ利用者による、間の7版が非表示)

2行目:

[[PyTorch]]の上に構築されています。

~~学習と推論のサンプルコードが含まれています。~~

AudioCraftには学習と[[推論]]のサンプルコードが含まれています。とくに推論については高品質な音楽を生成できるAudioGenとMusicGenという2つの推論モデルが同梱されています。

~~とくに推論については高品質な音楽を生成できるAudioGenとMusicGenという2つの推論モデルが同梱されています。~~

== ライセンス ==

17行目:

16行目:

== 動作環境 ==

* VRAM 16GB の GPU

; Python 3.9

*: AudioCraftで中規模の推論モデルを実行するためには少なくとも16GBの[[VRAM]]を持つ[[GPU]]を必要とします。

Python 3.10では動かないようです。

Python 3.9にダウングレードしたら動きました。

まず[[ビデオカード]]~~の敷居が高い。~~

; VRAM 16GB の GPU

まず[[ビデオカード]]の敷居が高い。AudioCraftで中規模の推論モデルを実行するためには少なくとも16GBの[[VRAM]]を持つ[[GPU]]を必要とします。

軽く試した感じでは時間30秒に設定した mediumモデルでVRAM使用量は11GB前後となっています。やはりVRAM12GBのビデオカードではかなり厳しいと思われます。

速度を求めないなら[[メインメモリ]]が多めの[[Ryzen APU]]か[[Mac]] ([[Apple Silicon]])を使用するのが手軽かと思います。

== 外部リンク ==

@@ 2行目: / 2行目: @@
 [[PyTorch]]の上に構築されています。
-学習と推論のサンプルコードが含まれています。
+AudioCraftには学習と[[推論]]のサンプルコードが含まれています。とくに推論については高品質な音楽を生成できるAudioGenとMusicGenという2つの推論モデルが同梱されています。
-とくに推論については高品質な音楽を生成できるAudioGenとMusicGenという2つの推論モデルが同梱されています。
 == ライセンス ==
@@ 17行目: / 16行目: @@
 == 動作環境 ==
-* VRAM 16GB の GPU
+; Python 3.9
-*: AudioCraftで中規模の推論モデルを実行するためには少なくとも16GBの[[VRAM]]を持つ[[GPU]]を必要とします。
+Python 3.10では動かないようです。
+Python 3.9にダウングレードしたら動きました。
-まず[[ビデオカード]]の敷居が高い。
+; VRAM 16GB の GPU
+まず[[ビデオカード]]の敷居が高い。AudioCraftで中規模の推論モデルを実行するためには少なくとも16GBの[[VRAM]]を持つ[[GPU]]を必要とします。
+軽く試した感じでは時間30秒に設定した mediumモデルでVRAM使用量は11GB前後となっています。やはりVRAM12GBのビデオカードではかなり厳しいと思われます。
+速度を求めないなら[[メインメモリ]]が多めの[[Ryzen APU]]か[[Mac]] ([[Apple Silicon]])を使用するのが手軽かと思います。
 == 外部リンク ==