ITAコーパスの424文をVOICEVOXを用いて出力します。
(一部の文は分割されているため進捗バーの分母は443となっています)
- VOICEVOX ENGINEをダウンロードして起動してください (VOICEVOXの起動でもOK)
- index.exe (またはpython index.py) を実行してください。ウィンドウが表示され「Voicevoxと接続中」と表示されます。
- 接続に成功すると話者とスタイル選択画面になります。話者とスタイルを選択してください。
- 選択したら「Start」を押して進捗が完了するまでお待ちください。
- 「出力完了」と表示されたら完了です。dataフォルダに以下の形で音声ファイルと読み仮名テキストが出力されています。
data
├── 3_ずんだもん_ノーマル
│ ├── text
│ │ ├── emotion001.txt
│ │ ├── emotion002.txt
│ │ ├── ...
│ └── wav
│ ├── emotion001.wav
│ ├── emotion002.wav
│ ├── ...
VOICEVOX ENGINEの起動に失敗してるかも。
VOICEVOX ENGINEの画面に Application startup complete.
と表示されているか確認してください。
それなりに時間がかかります。参考に私の環境では全部完了するのに45分程度かかります。
corpus.csvを別のファイルに置き換えてください。各行は「ファイル名,日本語文」です。
話者とスタイルは今起動しているVOICEVOX ENGINEから取得しています。
最新のVOICEVOX ENGINEを入手してください。
ITAコーパスの424文をAssistantSeikaを用いて出力します。
例えば東北きりたんの音声ファイルを出力する目的などで利用することを想定しています
きりたんになる場合はボイロで100から400文章程度をボイロに読ませるとできるかもですヽ(′▽︎`*)乂(*′▽︎`)ノ
— 東北ずん子💚きりたんボイスピ クラウドファンディング (@t_zunko) April 29, 2022
読ませる文章はITAコーパス使えばいいのでどなたか良ければやってみてください⸜( ´ ꒳ ` )⸝♡︎
https://t.co/HDwbDZielq
- AssistantSeikaをダウンロードして起動してください
- 使用製品のスキャンを行ってください(スキャン時の音声効果で収録されます)
- 画像の通りにHTTP機能を設定してください (ワークフォルダとドキュメントルートフォルダは自由に設定してください)
- seika.exe (またはpython seika.py) を実行してください。ウィンドウが表示され「AssistantSeikaと接続中」と表示されます。
- 接続に成功すると話者選択画面になります。話者を選択してください。
- 選択したら「Start」を押して進捗が完了するまでお待ちください。
(再生されている全音声がwavに記録されるようなので他音声が鳴っていない状態にしてください) - 「出力完了」と表示されたら完了です。dataフォルダに音声ファイルが出力されています。
data
├── 1707_東北きりたん EX_VOICEROID+EX_1707
│ └── wav
│ ├── emotion001.wav
│ ├── emotion002.wav
│ ├── ...
- 2023/01/14 00:48 制作開始
- 2023/01/14 02:26 ITAコーパスからCSV作成完了
- 2023/01/14 11:15 実装完了
- 2023/01/14 11:50 GithubのReadme整備
- 2023/01/28 22:00 AssisantSeikaに対応
- 2023/01/29 01:40 AssisantSeikaから収集する音声を22000HZに変更