报错:页面文件太小,无法完成操作。
    答:增大系统虚拟内存大小,方法各种地方都能搜得到,不展开了。

    报错:torch.cuda.OutOfMemoryError: CUDA out of memory
    答:爆显存了,首先确保你的虚拟内存在 30-50G 以上,预处理遇到的话换用除 crepe 以外的 f0 预测器,训练遇到的话调小批量大小,推理遇到的话使用强制切片或 CPU 推理。当然一劳永逸的解决方法是换一张大显存显卡。

    报错:RuntimeError: Current CUDA Device does not support bfloat16. Please switch dtype to float16
    答:你的显卡不支持 bf16 训练。如果你选择的是 fp32 还有这个报错的话,请打开你的配置文件,确认 “fp16_run” 一项为 false,并且 “half_type” 为 “fp16”

    报错:RuntimeError: DataLoader worker (pid(s) xxxx) exited unexpectedly
    答:把虚拟内存再调大一点。

    报错:CUDA error: CUBLAS_STATUS_NOT_INITIALIZED when calling ‘cublasCreate(handle)’
    答:爆显存了,基本上跟 CUDA 有关的报错大都是爆显存……

    报错:torch.multiprocessing.spawn.ProcessExitedException: process 0 terminated with exit code 3221225477
    答:调大虚拟内存

    报错:’HParams’ object has no attribute ‘xxx’
    答:无法找到音色,一般是配置文件和模型没对应,打开配置文件拉到最下面看看有没有你训练的音色

    报错:The expand size of the tensor (768) must match the existing size (256) at non-singleton dimension 0.
    答:把 dataset/44k 下的内容全部删了,重新走一遍预处理流程

    报错:Given groups=1, weight of size [xxx, 256, xxx], expected input[xxx, 768, xxx] to have 256 channels, but got 768 channels instead
    答:vec256 的模型用了 vec768 的配置文件,如果上面报错的 256 的 768 位置反过来了那就是 vec768 的模型用了 vec256 的配置文件,请参考本文的的旧模型兼容,确认你的配置文件和模型维度对应。

    报错:配置文件中的编码器与模型维度不匹配
    答:在修改配置文件中的 “speech_encoder” 时修改错了,检查配置文件中的 “ssl_dim” 一项,如果这项是 256,那你的 speech_encoder 应当修改为 “vec256l9”,如果是 768,则是 “vec768l12”

    报错:模型说话人数量与 emb 维度不匹配
    答:配置文件中的 “n_speakers” 一项与模型中实际的说话人数量不一致。你应当将 “n_speaker” 修改为大于等于模型中实际的说话人数量。当然,出现这一错误更有可能是你没有选择模型对应的配置文件。

    报错:配置文件与模型不匹配
    答:配置文件中的模型维度与模型的实际维度不一致。出现这一报错说明没有选择模型对应的配置文件。

    报错:扩散模型维度与主模型不匹配,请确保两个模型使用的是同一个编码器
    答:扩散模型训练时使用的编码器需要和主模型是同一个,目前扩散模型只支持 vec768l12,hubertsoft 和 whisper-ppg.

    报错:所选模型缺少 emb_g.weight,你可能选择了一个底模
    答:我本来觉得这个报错写得很清楚了,为什么,怎么做都告诉你了,但还是一直有人问。
    不要选择 G_0 底模!! 如果列表里只有 G_0 说明模型还没保存,别这么急,等 800 步保存了再来。如果已经 800 步保存了点一下下面的刷新选项按钮。

    报错:Cannot load audio from file: ffprobe not found. Please install ffmpeg in your system to use non-WAV audio file formats and make sure ffprobe is in your PATH.
    答:更新到 v2.3.7 之后的整合包。或者手动把 FFmpeg 添加到系统环境变量中。

    报错:No module named ‘faiss.swigfaiss_avx2’
    答:特征检索模型需要在本地训练本地推理,云端训练的特征检索模型因为环境问题可能无法在本地使用。

    报错:Expecting value: line 1 column 1 (char 0)
    答:关闭全局梯子

    报错:error: emb_g.weight is not in the checkpoint
    答:这其实不是报错,首次训练时出现这一条恰恰说明你的底模被成功加载了,属于正常现象,不用担心。

    如果你的问题不在上面的常见报错里,可以在交流群里咨询你的问题。但提问也是有讲究的,一个好的提问能让他人有回复的兴致,问题解决的速度就越快,节省了你的时间也降低了大家的血压,两全其美。

    1. 喊 “大佬救命” 并不能让你更快得到帮助,反而会让人血压升高。少一些和问题无关的语言。
    2. 详细描述你现在正在遇到的问题,以及你在遇到问题之前做了些什么。很多时候你遇到问题可能只是因为忘记做了某个步骤,甚至有时候捋一遍自己就能发现问题在哪。
    3. 只贴一个红色的 “Error”,上帝来了也只能帮你算一卦。我需要的是详细的报错日志,这可以在终端里查看,也可以在 WebUI 打开 debug 模式。
    4. 多看文档多看文档多看文档。群里每天问的问题有 90% 都可以在文档找到解决方案。大家的时间都很宝贵,能自己解决就不要麻烦别人了。
      一个优秀的提问示例:
      大家好,我在使用特征检索模型时遇到了一点问题,终端报错是 “No module named ‘faiss.swigfaiss_avx2’”,这是终端报错截图:【完整报错截图】
      我用的模型是自己训练的,编码器是 vec768l12,配置文件的编码器是对应的。没有加载扩散模型,在加载模型的时候提示的这个报错。如果不加载特征检索模型就可以正常使用。特征检索模型是在云端训练后下载到本地的,在云端推理时可以加载。
      查看了文档的常见报错,并没有发现类似的问题。有人知道该怎么解决吗?感激不尽!
      一个错误的提问示例:
      大佬救命啊!!我推理的时候报错怎么办??