VOICEVOX

VOICEVOXとは、ドワンゴ（ニコニコ動画）の中の人が中心となりオープンソースのもとで開発されている日本語の音声合成する（テキストを読み上げる）ソフトウェアである。

特徴[編集 | ソースを編集]

商用・非商用問わず無料
- 詳しくは各キャラクターの利用規約をご参照ください
すぐに使えるソフトウェア
- 現在は Windows / Mac / Linux に対応しています
イントネーションの詳細な調整が可能

実行[編集 | ソースを編集]

Electron と Python 3.8 (3.9) さえ動けば動けばほぼ動く模様。ググると「メモリそこそこ多め」だけが動作条件のようでRaspberry Pi 4のメモリ8GBモデルなんかでも動くようだ。なお、メモリ1GBのRaspberry Pi 3 model Bでもスワップメモリを多め設定しておくと動くが遅すぎてヤバい。

用語[編集 | ソースを編集]

VOICEVOX CORE[編集 | ソースを編集]

コアの部分。rustで書かれている。

VOICEVOX ENGINE[編集 | ソースを編集]

COREをラップしたWeb API。Pythonで書かれている。

VOICEVOX[編集 | ソースを編集]

ENGINEをラップしたGUIエディター。Electron + Vue + TypeScriptで書かれている。

備考[編集 | ソースを編集]

ユーザー辞書周りの処理はOpen JTalkからフォークして改良を加えたもとなっています。そのOpen JTalkのユーザー辞書周りはMeCabからのフォークです。完全に再実装しようと思ったらMeCabから移植が必要なようです。