「AudioCraft」の版間の差分

編集の要約なし
 
(同じ利用者による、間の8版が非表示)
2行目: 2行目:
[[PyTorch]]の上に構築されています。
[[PyTorch]]の上に構築されています。


学習と推論のサンプルコードが含まれています。
AudioCraftには学習と[[推論]]のサンプルコードが含まれています。とくに推論については高品質な音楽を生成できるAudioGenとMusicGenという2つの推論モデルが同梱されています。
とくに推論については高品質な音楽を生成できるAudioGenとMusicGenという2つの推論モデルが同梱されています。


== ライセンス ==
== ライセンス ==
17行目: 16行目:


== 動作環境 ==
== 動作環境 ==
* 16GBのGPU
; Python 3.9
*: AudioCraftで中規模の推論モデルを実行するためには少なくとも16GBの[[VRAM]]を持つ[[GPU]]を必要とします。
Python 3.10では動かないようです。
Python 3.9にダウングレードしたら動きました。


まず[[ビデオカード]]の敷居が高い。
; VRAM 16GB の GPU
まず[[ビデオカード]]の敷居が高い。AudioCraftで中規模の推論モデルを実行するためには少なくとも16GBの[[VRAM]]を持つ[[GPU]]を必要とします。
 
軽く試した感じでは時間30秒に設定した mediumモデルでVRAM使用量は11GB前後となっています。やはりVRAM12GBのビデオカードではかなり厳しいと思われます。
 
速度を求めないなら[[メインメモリ]]が多めの[[Ryzen APU]]か[[Mac]] ([[Apple Silicon]])を使用するのが手軽かと思います。


== 外部リンク ==
== 外部リンク ==