GPT-SoVITS AI 音色克隆软件使用指南
## GPT-SoVITS: 仅需1分钟语音数据训练TTS模型**GitHub:** (https://github.com/RVC-Boss/GPT-SoVITS)
**官方演示:** (https://www.bilibili.com/video/BV12g4y1m7Uw)
**功能:**
* **零样本TTS:** 5秒音频样本即可实现文本转语音。
* **少样本TTS:** 1分钟训练数据即可微调模型,提升语音相似度和真实感。
* **跨语言支持:** 支持与训练数据集不同的语言推理,包括英语、日语和中文。
* **WebUI工具:** 提供声音伴奏分离、自动训练集分割、中文自动语音识别(ASR)和文本标注功能,方便用户创建训练数据集和模型。
**使用过程简介:**
1. **数据处理:** UVR5人声处理、音频切割、降噪、打标和校对。
2. **训练:** 数据集准备、模型微调。
3. **推理:** 使用训练好的模型进行文本转语音。
**教程:**
* **环境:** Ubuntu 22.04,NVIDIA RTX A6000
* **部署方式:** Docker
* **docker-compose.yaml:** (https://raw.githubusercontent.com/RVC-Boss/GPT-SoVITS/main/docker-compose.yaml)
**步骤:**
1. 创建目录并下载docker-compose.yaml,模型镜像约5G。
2. 修改docker-compose.yaml,映射GPT_weights文件夹。
3. 启动Docker服务。
4. 打开浏览器访问WebUI (http://0.0.0.0:9874)。
5. 进行数据处理、训练和推理。
**注意:**
* 服务器需要开放9874、9873、9872、9871、9880端口。
* 若端口冲突,需修改docker-compose.yaml中的端口映射。
页:
[1]