音频 语音
GPT-SoVITS声音克隆

GPT-SoVITS是一个开源的声音克隆项目,由B站UP主、RVC变声器创始人花儿不哭 推出

广告也精彩
广告也精彩

1、GPT-SoVITS简介

GPT-SoVITS是一个开源的声音克隆项目,由B站UP主、RVC变声器创始人花儿不哭 推出,该语音合成工具结合了GPT(Generative Pre-trained Transformer)模型和SoVITS(Speech-to-Video VoiceTransformation System)变声器技术,仅需通过少量的样本数据实现高质量的语音克隆和文本到语音转换(TTS)。该工具特别适用于需要快速生成特定人声的场景,可以帮助用户在没有或只有少量目标说话人语音样本的情况下,训练出能够模仿该说话人声音(包括情感、音色、语速)的模型。

 

2、GPT-SoVITS的官网入口

 

3、使用Google-Colab版注意事项

①打开Google Colab地址;

②在菜单“修改”-“笔记本设置”中,选择显卡“GPU”;

③然后在菜单“代码执行程序”中,选择“运行全部”;

④最后运行结束,打开输出结果给出的public URL(只持续72小时);

⑤具体操作看下面的B站UP“痕继痕迹”教学视频;

⑥由于是使用Colab在云端,所以要上传音频文件到Colab服务器上,这样在Web UI中填写input地址时,就要填写服务器的音频文件地址。

 

4、以下是B站UP“痕继痕迹”的GPT-SoVITS教学视频(推荐):

 

5、以下是原创作者“花儿不哭”的B站演示视频:

 

6、以下是B站UP“西佩特”的GPT-SoVITS保姆级系列教学视频:

课程目录:

GSV教程1:声音克隆

GSV教程2:人声分离和手工校对标注

GSV教程3:训练英文模型

GSV教程4:在Colab中使用GPT-SoVITS

GSV教程5:如何调用API

GSV教程6:新增自动选取参考音频和保存音频历史功能

GSV教程7:API优化及在线推理模型的使用

GSV教程8:0306整合包集成TTS API功能及流式音频生成测试

GSV教程9:极速推理版功能测试和0306fix版本介绍

GSV教程10.1:基于0306FIX版超详细教程 | 训练

GSV教程10.2:基于0306FIX版超详细教程 | 推理

相关导航

广告也精彩

暂无评论

您必须登录才能参与评论!
立即登录
暂无评论...