VOICEVOX
ナビゲーションに移動
検索に移動
VOICEVOXとは、ドワンゴ(ニコニコ動画)の中の人が中心となりオープンソースのもとで開発されている日本語の音声合成する(テキストを読み上げる)ソフトウェアである。
特徴
- 商用・非商用問わず無料
- 詳しくは各キャラクターの利用規約をご参照ください
- すぐに使えるソフトウェア
- イントネーションの詳細な調整が可能
実行
Electron と Python 3.8 (3.9) さえ動けば動けばほぼ動く模様。 ググると「メモリそこそこ多め」だけが動作条件のようでRaspberry Pi 4のメモリ8GBモデルなんかでも動くようだ。なお、メモリ1GBのRaspberry Pi 3 model Bでもスワップメモリを多め設定しておくと動くが遅すぎてヤバい。
用語
VOICEVOX CORE
コアの部分。rustで書かれている。
VOICEVOX ENGINE
COREをラップしたWeb API。Pythonで書かれている。
VOICEVOX
ENGINEをラップしたGUIエディター。Electron + Vue + TypeScriptで書かれている。
備考
ユーザー辞書周りの処理はOpen JTalkからフォークして改良を加えたもとなっています。 そのOpen JTalkのユーザー辞書周りはMeCabからのフォークです。 完全に再実装しようと思ったらMeCabから移植が必要なようです。