三色堇 可以呀,就当交流学习了呗。
其实 TTS 的音色主要还是看 AI 的声音模型,台本是次要的,如果换成后来找到的八重神子的模型,应该会再好一些。
同时因为我用的是 GPT-Sovits,它并不支持使用类似(生气) (伤心) (兴奋) (惊讶) (满意) (高兴)
这种带有感情暗示的关键字。Fish-speech 是支持的,不过就是因为已经弄完了,暂时先不重新跑一次了。
之后听的人多了,有需求的话,可以再重新跑一次。
但不管怎样,stella 本身的声音太独特了,有能力、有条件,还是建议听原本,效果不一样的。