Whatmortal erluodeming ASR并没有比whisper明显好的多的选项,但是多模态的LLM已经能凭借丰富的知识帮忙检查ASR结果了,打轴要自己适当调整一些。Gemini 2.5 Pro似乎可以直出字幕,但是时间轴是偏快的,音频越长越对不上。 翻译已经可以比较稳的靠AI来完成任务了,个别用词可以自己调一调。 TTS克隆有更多选项了,但是太色情的语气还是不够好,典型的耳语,哦吼还弄不好,普通的语气已经差不太多了。全自动的SOTA语音带克隆端到端翻译还有很长的路要走。 欢迎自行探索哈
lorrine 请问从在线音声里完整听了一遍中间因为网络问题中断了好几次,爬起来看手机但似乎没有解除催眠,躺下后又乖乖被强制高潮了好几次?甚至解除后连中间似乎“有意识”的记忆也模糊了,这是正常的现象嘛 以及在整个过程中没有太多强烈的“快感”,但身体就是不由自主的痉挛发麻,有没有什么办法可以进一步增大快感呀🥺