VOICEVOX
2023年4月27日 (木) 01:44時点におけるAdministrator (トーク | 投稿記録)による版
VOICEVOXとは、ドワンゴ(ニコニコ動画)の中の人が中心となりオープンソースのもとで開発されている日本語の音声合成する(テキストを読み上げる)ソフトウェアである。
特徴[編集 | ソースを編集]
- 商用・非商用問わず無料
- 詳しくは各キャラクターの利用規約をご参照ください
- すぐに使えるソフトウェア
- イントネーションの詳細な調整が可能
実行[編集 | ソースを編集]
Electron と Python 3.8 (3.9) さえ動けば動けばほぼ動く模様。 ググると「メモリそこそこ多め」だけが動作条件のようでRaspberry Pi 4のメモリ8GBモデルなんかでも動くようだ。なお、メモリ1GBのRaspberry Pi 3 model Bでもスワップメモリを多め設定しておくと動くが遅すぎてヤバい。
用語[編集 | ソースを編集]
VOICEVOX CORE[編集 | ソースを編集]
コアの部分。rustで書かれている。
VOICEVOX ENGINE[編集 | ソースを編集]
COREをラップしたWeb API。Pythonで書かれている。
VOICEVOX[編集 | ソースを編集]
ENGINEをラップしたGUIエディター。Electron + Vue + TypeScriptで書かれている。
備考[編集 | ソースを編集]
ユーザー辞書周りの処理はOpen JTalkからフォークして改良を加えたもとなっています。 そのOpen JTalkのユーザー辞書周りはMeCabからのフォークです。 完全に再実装しようと思ったらMeCabから移植が必要なようです。