メインメニューを開く

「AudioCraft」を編集中

警告: ログインしていません。編集を行うと、あなたの IP アドレスが公開されます。ログインまたはアカウントを作成すれば、あなたの編集はその利用者名とともに表示されるほか、その他の利点もあります。

この編集を取り消せます。 下記の差分を確認して、本当に取り消していいか検証してください。よろしければ変更を保存して取り消しを完了してください。

最新版 編集中の文章
2行目: 2行目:
 
[[PyTorch]]の上に構築されています。
 
[[PyTorch]]の上に構築されています。
  
AudioCraftには学習と推論のサンプルコードが含まれています。とくに推論については高品質な音楽を生成できるAudioGenとMusicGenという2つの推論モデルが同梱されています。
+
学習と推論のサンプルコードが含まれています。
 +
とくに推論については高品質な音楽を生成できるAudioGenとMusicGenという2つの推論モデルが同梱されています。
  
 
== ライセンス ==
 
== ライセンス ==
9行目: 10行目:
 
*: https://creativecommons.org/licenses/by-nc/4.0/deed.ja
 
*: https://creativecommons.org/licenses/by-nc/4.0/deed.ja
  
AudioGenやMusicGenで生成した音楽は非商用に限り[[YouTube]]などでも使用できます。
+
AudioGenやMusicGenで生成した音楽は[[YouTube]]などでも使用できます。
本モデルを使用していることを説明欄に明記し、かつ収益化してはならない(≒広告を入れてはならない)という点に注意してください。
+
ただし、本モデルを使用していることを説明欄に明記し、かつ収益化してはならないという点に注意してください。
  
*個々の動画で広告表示を無効にする方法
+
個々の動画で広告表示を無効にする方法
*: https://support.google.com/youtube/answer/6332943?hl=ja
+
* https://support.google.com/youtube/answer/6332943?hl=ja
 
 
== 動作環境 ==
 
; Python 3.9
 
Python 3.10では動かないようです。
 
Python 3.9にダウングレードしたら動きました。
 
 
 
; VRAM 16GB の GPU
 
まず[[ビデオカード]]の敷居が高い。AudioCraftで中規模の推論モデルを実行するためには少なくとも16GBの[[VRAM]]を持つ[[GPU]]を必要とします。
 
 
 
軽く試した感じでは時間30秒に設定した mediumモデルでVRAM使用量は11GB前後となっています。やはりVRAM12GBのビデオカードではかなり厳しいと思われます。
 
 
 
速度を求めないなら[[メインメモリ]]が多めの[[Ryzen APU]]か[[Mac]] ([[Apple Silicon]])を使用するのが手軽かと思います。
 
  
 
== 外部リンク ==
 
== 外部リンク ==

MonoBookへの投稿はすべて、他の投稿者によって編集、変更、除去される場合があります。 自分が書いたものが他の人に容赦なく編集されるのを望まない場合は、ここに投稿しないでください。
また、投稿するのは、自分で書いたものか、パブリック ドメインまたはそれに類するフリーな資料からの複製であることを約束してください(詳細はMonoBook:著作権を参照)。 著作権保護されている作品は、許諾なしに投稿しないでください!

このページを編集するには、下記の確認用の質問に回答してください (詳細):

取り消し 編集の仕方 (新しいウィンドウで開きます)