ChatGPT语音模式迎来重大升级!
还记得去年OpenAI推出的GPT-4o吗?现在,它的语音模式又牛了!这次升级让ChatGPT的语音交流变得更像真人聊天,告别了以往那种生硬的机器感。这次更新可不简单,它基于原生的多模态模型,反应速度贼快,最快232毫秒就能回应,平均也就320毫秒,这速度,跟人说话差不多!
其实年初的时候,OpenAI就小修小补了一下语音模式,改善了打断和口音识别。这次可是大动作!语音回复的语调更细腻了,节奏也更自然,尤其是停顿和语气重音,处理得特别到位。更厉害的是,现在它还能表达各种情绪了,像同情、讽刺,都能拿捏得住,让咱跟机器聊天也觉得有人情味儿了。
实时翻译,随时切换!
更让人惊喜的是,这次更新还加了个实时翻译的功能!跟ChatGPT聊天的时候,你只需要发个指令,它就能边说边翻译,直到你喊停。有了这个功能,以后出国旅游,或者跟老外交流,就不用单独开翻译APP了,ChatGPT直接搞定,方便多了!不过,目前这个高级语音模式只有付费用户才能体验哦。
别高兴太早,还有点小问题
虽然这次升级进步很大,但OpenAI也承认,现在还有一些已知的问题。比如,有时候音质会稍微下降,音调和语调可能也会出现一些奇怪的变化,尤其是在某些语音选项里更明显。另外,偶尔还会冒出一些不该有的声音,比如广告、胡言乱语,甚至背景音乐,这跟真人聊天可不一样啊。OpenAI说了,他们会继续努力,提升音频的稳定性,慢慢解决这些问题。
AI语音交互,未来大有发展
总的来说,这次升级让AI的语音交互体验更自然了,也为人类和AI之间的沟通打下了更好的基础。虽然还有一些小问题,但相信OpenAI会不断改进,让AI语音越来越接近真人,甚至超越真人!