「AudioCraft」を編集中

'''AudioCraft'''とは、2023年6月に[[Meta]]（[[facebook]]）が[[オープンソース]]の下で公開した[[人工知能]]による音声に特化した[[Python]]向けの[[ライブラリ]]です。
[[PyTorch]]の上に構築されています。

学習と推論のサンプルコードが含まれています。
とくに推論については高品質な音楽を生成できるAudioGenとMusicGenという2つの推論モデルが同梱されています。

== ライセンス ==
* ソースコードは[[MITライセンス]]
* 付属の推論モデルは[[CC-BY-NC 4.0]]
*: https://creativecommons.org/licenses/by-nc/4.0/deed.ja

AudioGenやMusicGenで生成した音楽は非商用に限り[[YouTube]]などでも使用できます。
本モデルを使用していることを説明欄に明記し、かつ収益化してはならない（≒広告を入れてはならない）という点に注意してください。

*個々の動画で広告表示を無効にする方法
*: https://support.google.com/youtube/answer/6332943?hl=ja

== 動作環境 ==
* 16GBのGPU
*: AudioCraftで中規模の推論モデルを実行するためには少なくとも16GBの[[VRAM]]を持つ[[GPU]]を必要とします。

まず[[ビデオカード]]の敷居が高い。

== 外部リンク ==
* https://github.com/facebookresearch/audiocraft

[[category: 人工知能]]
@@ 2行目: / 2行目: @@
 [[PyTorch]]の上に構築されています。
-AudioCraftには学習と推論のサンプルコードが含まれています。とくに推論については高品質な音楽を生成できるAudioGenとMusicGenという2つの推論モデルが同梱されています。
+学習と推論のサンプルコードが含まれています。
+とくに推論については高品質な音楽を生成できるAudioGenとMusicGenという2つの推論モデルが同梱されています。
 == ライセンス ==
@@ 16行目: / 17行目: @@
 == 動作環境 ==
-; Python 3.9
+* 16GBのGPU
-Python 3.10では動かないようです。
+*: AudioCraftで中規模の推論モデルを実行するためには少なくとも16GBの[[VRAM]]を持つ[[GPU]]を必要とします。
-Python 3.9にダウングレードしたら動きました。
-; VRAM 16GB の GPU
+まず[[ビデオカード]]の敷居が高い。
-まず[[ビデオカード]]の敷居が高い。AudioCraftで中規模の推論モデルを実行するためには少なくとも16GBの[[VRAM]]を持つ[[GPU]]を必要とします。
-軽く試した感じでは時間30秒に設定した mediumモデルでVRAM使用量は11GB前後となっています。やはりVRAM12GBのビデオカードではかなり厳しいと思われます。
-速度を求めないなら[[メインメモリ]]が多めの[[Ryzen APU]]か[[Mac]] ([[Apple Silicon]])を使用するのが手軽かと思います。
 == 外部リンク ==