阿里推出的实时语音识别开源项目
阿里推出的声音克隆,语音生文字功能
增强版ChaTTTS,各方面性能大幅超越原版ChaTTTS,感谢CCmahua大佬的开源!
Faster-Whisper是基于 OpenAI Whisper模型的重写,在相同精度上,Faster-Whisper的语音转写速度比OpenAI快4倍
ChatTTS 是一个专门为对话场景设计的 TTS 项目,支持中英文语音生成,由于声音过于逼真,所以暂时不支持克隆声音功能
GPT-SoVITS是一个开源的声音克隆项目,由B站UP主、RVC变声器创始人花儿不哭 推出
UVR5 是一款开源免费的人声伴奏分离工具,提取的效果堪比原版伴奏,支持多种算法和 CUDA 加速
Reecho语音大模型可理解文本上下文,并以与真人几乎无异的拟真度、表现力、情感、韵律和音色来基于文本生成人声音频,并且支持以极短样本进行无需训练的瞬时语音克隆,或使用较长样本进行精益求精的专业语音克隆
一款功能强大,专业实用的优秀变声器软件
讯飞推出的AI虚拟主播配音工具
字节跳动旗下文生音工具
抖音旗下声音克隆工具
微软推出的文生音TTS工具
OpenAI推出的文生音工具