Sia
这个听起来好多了,没有太出戏的AI音了,人声的音色、发音、词句衔接都很不错了,背景音也合适,已经是可以“使用”的程度了呢
剩下应该就是台本精译、润色了吧
另外,差不多4分钟(3分30秒整)之后就没有人声只有背景音了,是不是就是中文比英文短,中文都说完了,原英文版还没完,就只剩下背景音了?还是后面还有没翻译的?如果是前者,那就还需要有校对时间轴的工作
最后,如果在适当节点再加些特殊音效就更好了,比如娇喘音、吸吮音、鞭打声等,触发暗示的比如响指,微调局部的语速或声调,比如引诱时的拉长音(过来~嘛),斥责时的加重音(给我跪!下)等,不过这个需要有相关素材,也需要定位时间轴,工作量会变大很多,属于锦上添花、追求完美了,刚开始还不是必须的