VOICEVOX

提供: MonoBook
ナビゲーションに移動 検索に移動

VOICEVOXとは、ドワンゴニコニコ動画)の中の人が中心となりオープンソースのもとで開発されている日本語の音声合成する(テキストを読み上げる)ソフトウェアである。

特徴

  • 商用・非商用問わず無料
    • 詳しくは各キャラクターの利用規約をご参照ください
  • すぐに使えるソフトウェア
  • イントネーションの詳細な調整が可能

実行

ElectronPython 3.8 (3.9) さえ動けば動けばほぼ動く模様。 ググると「メモリそこそこ多め」だけが動作条件のようでRaspberry Pi 4のメモリ8GBモデルなんかでも動くようだ。なお、メモリ1GBのRaspberry Pi 3 model Bでもスワップメモリを多め設定しておくと動くが遅すぎてヤバい。

用語

VOICEVOX CORE

コアの部分。rustで書かれている。

VOICEVOX ENGINE

COREをラップしたWeb APIPythonで書かれている。

VOICEVOX

ENGINEをラップしたGUIエディター。Electron + Vue + TypeScriptで書かれている。


備考

ユーザー辞書周りの処理はOpen JTalkからフォークして改良を加えたもとなっています。 そのOpen JTalkのユーザー辞書周りはMeCabからのフォークです。 完全に再実装しようと思ったらMeCabから移植が必要なようです。