Whatmortal [未知用户] 谢谢提供参考,台本基本有数了。双语可以用在CV语气非常难模拟的音声上,人形娼馆应该用不到双语。不过也可以试试把原CV的声音叠加进来,可以导致大脑宕机造成混乱或许也有用,到时候两个版本都丢出来试试水
Whatmortal o8o8kid 可以自己过滤人声就能分离出来效果音了。简单的做法就是剪映里面的人声分离,只剩背景音就可以了。目前剪映是最省心综合效果最好的。UVR5也可以做到,但是会有一些残余,可能可以多过滤几步降低,但是比较麻烦,效果一般来说不如剪映。
lslove 这个是我自己训练的八重神子朗读的。感觉比楼主的ai语音好一些,不过没有背景音和环境音乐 https://lsgdut-my.sharepoint.com/:u:/g/personal/lsgdut_c34_pw/Ea6C_ZBB9fpBlIfWXRF9ITUBZLJ1TPDFRYcca-2R-3fOzw?nav=eyJyZWZlcnJhbEluZm8iOnsicmVmZXJyYWxBcHAiOiJPbmVEcml2ZUZvckJ1c2luZXNzIiwicmVmZXJyYWxBcHBQbGF0Zm9ybSI6IldlYiIsInJlZmVycmFsTW9kZSI6InZpZXciLCJyZWZlcnJhbFZpZXciOiJNeUZpbGVzTGlua0NvcHkifX0&e=e1f00C