Sia 上面的音频是 demo 版,主要想收集下意见和反馈,比如: 音色是否能接受 翻译的是否生硬,符合语境,是否涩 断句是否合理等 音色这个基于当前的实现还是比较好做的,再集成一个音色提取逻辑就好,最次也可以用 lalal.ai 搞一下,就是要花点钱。 翻译和断句只能是慢慢调了,比如, sissy 这个单词到底是音译好,还是翻译成娘娘腔好,还有一些比较涩的单词等,需要长时间针对多数人的 xp 做调整。 完整版的话我自己听了一遍不太满意,就先不发了,之后优化完再分享。
空空空 Sia 现在好像有很多开源的音声合成AI模型,什么sovits,ddsp之类的,可以自己训练,也有训练好的,有些训练得比较不错的模型,已经非常自然柔和了,就是需要有张比较好的显卡,但是开源的好处就是除了显卡就不用花其他钱了 sissy 可以试试翻译成 小男娘
Sia AI 音色完整试听版《Sissy Curse》: https://mega.nz/file/9RITjahC#LAyqs4alpszm4e-KZPvODa3EuwO9rgZRD8jFmtAm_d4。 欢迎给点反馈。
Sia 御姐音色完整试听版《Sissy Curse》: https://mega.nz/file/NRZCjS5I#Ul7HEwGIUN7t4eauWrAv1BZPdglrWSMpYfsTravDSHc。 下午去老婆家了,说给我买了新制服让我赶紧来试试,所以就没时间继续弄了,晒个图(其他图之后修一修有空再晒,现在真的太胖了,修图工作量剧增,555,该减肥了)
Sia 御姐音色完整试听版《Sissy Curse》+ GPT-4 TTS: https://mega.nz/file/cdQ2jA4R#x6kSk_YK0rjstwupQFnyXjgw0cbTdP3LE6Q09DCwHJg。 这版似乎语言更自然一些,但发音还是有点奇怪,明天我看看 TTS 怎么能直接用 pretrain 的御姐 model,TTS API 不支持自定义 model。 而且“小男娘”为什么总念成“小蓝凉”啊,蓝瘦香菇~
Sia 空空空 EOS R6, 拍是用架子架上拍的,即使帮拍不是专业手也拿不稳的,角度拉到和脖子的高度就会比较好看,然后后面还有两个补光板,打软光,其他全靠后期。 头发我是上上周去接的,本来是长发的,3月份回了趟国剪短了应付家里人,后来又回来日本本来不打算再留长了,但老婆说不可爱了,所以就去接了。其实仔细看能看出来,因为都往两边跑,会显得很厚,同时也不太服帖。