2022-03-07 15:44:28 语音 编辑:黎为乐
aidatatang_200zh数据集格式:
-<自定义文件名>
-aidatatang_200zh
-corpus
-train
-<wav数据>
-transcript
-aidatatang_200_zh_transcript.txt
安装torch>1.7
运行pip install -r requirements.txt
以安装剩余的必要软件包。
安装 webrtcvad pip install webrtcvad-wheels
(如果需要)
使用已有模型或者自己训练
合成器模型下载-->地址
<datasets_root>替换为您的数据集根目录,<synthesizer_model_path>替换为您最好的 sythensizer 训练模型的目录,例如sythensizer\saved_mode\xxx
训练 wavernn 声码器: python vocoder_train.py mandarin <datasets_root>
训练 hifigan 声码器 python vocoder_train.py mandarin <datasets_root> hifigan
然后您可以尝试运行:python web.py
并在浏览器中打开它,默认为http://localhost:8080
然后您可以尝试工具箱: python demo_toolbox.py -d <datasets_root>