为了方便So-VITS-SVC后续更大规模的更新,项目对部分代码进行了重构,将部分模块与模型解耦,同时实现了多分支、多编码器完全整合。由于项目本体改动较大,本整合包也对部分代码进行了同步重构,并加入了新功能。现在你可以自由选择训练时使用的特征编码和f0提取,进一步提升模型质量;多分支(v1/vec768/hubertsoft)无缝整合,可以在整合包内自由切换推理。但由于改动较大,v1.x 版本整合包将无法通过增量更新升级到 v2.0 及后续版本。同时,先前训练的模型需要进行一些简单的操作才能够兼容 v2 整合包。
从 v1.x 升级到 v2
1.下载完整的最新 v2 整合包,并解压至任意目录2. 旧模型迁移:请按快速开始 - 从外部迁移模型部分内的指引迁移模型
3. 模型兼容性修改:在configs文件夹内用文本编辑器打开模型的对应配置文件,找到 “n_speakers” 项,在这一行最后添加一个英文逗号(“,”),然后添加新的两行:
"speech_encoder": "vec256l9", //如果是Vec768模型,这一项改为"vec768l12"
"speaker_embedding": false
:::color2 ⚠️请注意 “speech_encoder” 行后有一个英文逗号,而 “speaker_embedding” 后没有英文逗号。
:::
:::color1 如果不清楚自己的模型是Vec256还是Vec768,可以查看配置文件中的 “gin_channels” 和 “ssl_dim” 项来确认。
:::
如果你还是看不懂该怎么升级,或者对这一版本的新功能没有需求,也可以不更新。但后续So-VITS的所有重大更新都将基于2.0版本的整合包,因此你到时候还得走一遍更新流程。
"gin_channels": 768,
"ssl_dim": 768,
"n_speakers": 1,
"speech_encoder": "vec768l12",
"speaker_embbeding": false
},