一、github克隆项目
克隆命令:
git clone https://github.com/babysor/Realtime-Voice-Clone-Chinese.git
二、Python环境
1. Python3.9下载以及Pycharm安装
可以参考这位大佬的文章 https://blog.csdn.net/c_lanxiaofang/article/details/109902269
2. 下载torch:
(一) 打开pycharm控制台查看环境: (二) 环境正确后安装torch,命令如下
pip install torch==1.9.0 -i https://pypi.tuna.tsinghua.edu.cn/simple
pip install torchvision==0.10.0 -i https://pypi.tuna.tsinghua.edu.cn/simple
3. 其他必须需要的库:
pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple
4. 安装webrtcvad-wheels:
pip install webrtcvad-wheels -i https://pypi.tuna.tsinghua.edu.cn/simple
5. 安装ffmpeg:
安装过程参考: https://blog.csdn.net/xiaoxueyaoxuexi/article/details/110451006
三、运行代码
1. 下载预训练模型
链接:https://pan.baidu.com/s/1Scp1pzKJVeSa_ZlOQm-wGA 提取码:2021
2. 将saved_models放入项目中的synthesizer目录中
3. 终端输入指令
(一)GUI界面: 命令:
python demo_toolbox.py
截图:
(二)web界面: 命令:
python web.py
截图:
|