之前还真对这个方面有设想过。
我个人感觉rvc或者sovits,真人去读翻译的字幕,通过rvc或者sovits用模型,变成想要的音色。
这样的条件感觉简单一些,也不会出现日文ai转中文的"大佐感"(其实用动漫和日v搞出来的模型说中文也会有也有大佐感的,所以应该只能用中文训练来的模型)
我个人感觉自娱自乐应该是足够了。
但是说实话
缺点也很明显
不是专业的音声录制者,再加上可能的"母语羞耻",部分,或者说大部分情况下,效果可能比小野猫什么的也要差不少。
总结一下——(脑测)
好处就是可以自己汉化想要的日文音声,而且音色可以自己调整,没有大佐感,没有机翻感,可以自己再润色调整。
劣势就是工作量虽然感觉比较小,但实际上也挺多的,要考虑多次反复录制才能成功的可能性(大家都不是专业人士),以及录出来之后语气、情绪等可以说必定出现的问题,实际上也不是一个简单活。