转载自:https://link.syouiti.com/leijunvits
需要下载的
1.整合包
2.语音模型(123网盘 百度网盘)
3.Python PyTorch CUDA(可忽略)自己去官网下
使用
安装
安装好整合包后在整合包内打开cmd输入
1 | pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple |
Copy
安装依赖。
然后把网盘链接内的2个weights文件夹内的文件放到整合包内对应的weights文件夹内
打开
然后打开整合包目录内的go-webui.bat。
浏览器自动打开后(如没有自动打开可手动输入http://localhost:9874/)
点击1-GPT-SOVITS-TTS→勾选‘启用并行推理版本(推理速度更快)’(可选)→开启TTS推理webui
使用
新浏览器页面内先切换模型(建议左边选14,右边选12),然后上传参考音频(在我给的网盘包的output\denoise_opt中选择,对应的中文在output\asr_opt\denoise_opt.list文件内,注意时长不要超过10s)
下面的参数不是很建议大改(建议speed_factor=0.95,分段间隔(秒)=0.25,更像雷总本人。如果你显存大(cpu跑的话内存大)可以适当拉高batch_size,实测2060 6G可以拉到60,不过速度貌似没啥明显变化)
’需要合成的文本‘内就添加自己想要的文本,同一行的文本不要太多,可以使用回车换行,比如
正确示范
1 | 不觉得这很酷吗 |
Copy
错误示范
1 | 不觉得这很酷吗,这真的太酷了,科技并伴有趣味,很符合我对未来的想象。 |
Copy
然后点下面的合成就好,想要保存就直接点击下载,也可以翻文件夹,但合成的语音多了你很容易找不见想要的。
最下面自带切分工具
视频教程
我(给个三连,别逼我求你)
痕迹科技(强烈推荐)
花儿不哭(项目作者)
附加链接
原项目GitHub,可以点个star
python官网
PyTorch官网(这个requirement.txt里面有,pip会自动装)
CUDA