VOICEVOX

提供: MonoBook
ナビゲーションに移動 検索に移動

VOICEVOXとは、ドワンゴニコニコ動画)の中の人が中心となりオープンソースのもとで開発されている日本語の音声合成する(テキストを読み上げる)ソフトウェアである。

特徴[編集 | ソースを編集]

  • 商用・非商用問わず無料
    • 詳しくは各キャラクターの利用規約をご参照ください
  • すぐに使えるソフトウェア
  • イントネーションの詳細な調整が可能

実行[編集 | ソースを編集]

ElectronPython 3.8 (3.9) さえ動けば動けばほぼ動く模様。 ググると「メモリそこそこ多め」だけが動作条件のようでRaspberry Pi 4のメモリ8GBモデルなんかでも動くようだ。なお、メモリ1GBのRaspberry Pi 3 model Bでもスワップメモリを多め設定しておくと動くが遅すぎてヤバい。

用語[編集 | ソースを編集]

VOICEVOX CORE[編集 | ソースを編集]

コアの部分。rustで書かれている。

VOICEVOX ENGINE[編集 | ソースを編集]

COREをラップしたWeb APIPythonで書かれている。

VOICEVOX[編集 | ソースを編集]

ENGINEをラップしたGUIエディター。Electron + Vue + TypeScriptで書かれている。


備考[編集 | ソースを編集]

ユーザー辞書周りの処理はOpen JTalkからフォークして改良を加えたもとなっています。 そのOpen JTalkのユーザー辞書周りはMeCabからのフォークです。 完全に再実装しようと思ったらMeCabから移植が必要なようです。