我相信很多没有经验的人都不知道如何构建基于RTVC 7语音克隆模型的Tuned-GE2E-SayEN-EarSpeech。因此,本文总结了出现问题的原因和解决方法,希望大家可以通过这篇文章来解决这个问题。
00-1010与https://blog.csdn.net/u013625492/article/details/114433738 GE2E的版本几乎相同
不同的是文本是 英文, 使用 VCTK 等英文数据集的训练。
0. 说明
https://github.com/ruclion/Tuned-GE2E-SayEN-EarSpeech
00-1010
1.Git Clone
,AutoVC在训练前使用。
数据处理的逻辑从:/CEPH/家/hujk 17/tuned-ge2e-sayen-ear speech/fapig _ extract _ ge2e _ vctk _ no sli . py开始。
火车,瓦尔,看不见的都被保留了。训练只使用训练。
00-1010也是在2.1中提取的。使用 GE2E.
00-1010也是在2.1中提取的。使用 实验室的 mel. 和合(ˇ),终于方便了。
2. 训练数据
符号不用动,保留英文标点。
你需要改变火车的路线
以Kiss为车型名称,逻辑以Kiss_train.py开头
用原来的小批量直接训练,批量=12。
00-1010256 Embedding后面还是一个FC,和中文一致。
中文名为FaPig,英文名为Kiss,逻辑以Kiss_train.py开头
来自合成器。fapig _ trainimporttrain和from合成器。kiss _ trainimporttrain完全相同,只制作了一个副本来统一格式。
看完以上内容,你掌握了如何基于RTVC-7语音克隆模型构建Tuned-GE2E-SayEN-EarSpeech了吗?如果您想学习更多技能或了解更多相关内容,请关注行业资讯频道,感谢您的阅读!
内容来源网络,如有侵权,联系删除,本文地址:https://www.230890.com/zhan/142178.html