OpenAI于本周四宣布,其针对ChatGPT所研发的“高级语音模式”,这一模拟人类对话的功能,已经成功实现了视觉化升级。对于订阅了ChatGPT Plus、Team或Pro服务的用户而言,他们现在仅需通过手机摄像头对准任意物体,便能获得ChatGPT近乎即时的反馈与互动。
这一融合了视觉技术的高级语音模式,还额外具备了屏幕共享的强大功能。无论是解析复杂的设置菜单,还是为数学问题提供解答建议,它都能轻松应对。
操作方式也极为简便:用户只需在ChatGPT的聊天栏旁轻触语音图标,随后点击左下角新增的视频图标,即可开启视频互动。若需要共享屏幕内容,也只需点击三点菜单,并选择“共享屏幕”选项即可。
关于这一功能的推广计划,OpenAI表示,带视觉的高级语音模式将从本周四起逐步推出,并预计在下周内完成全面覆盖。但值得注意的是,并非所有用户都能立即享受到这一升级服务。ChatGPT Enterprise和Edu的用户需要耐心等待至明年1月,而欧盟、瑞士、冰岛、挪威以及列支敦士登等地区的用户,则还需等待进一步的时间安排通知。
在最近一期的CNN“60分钟”节目中,OpenAI总裁Greg Brockman向主持人Anderson Cooper亲自展示了高级语音模式的视觉分析能力。当Cooper在黑板上勾勒出人体部位时,ChatGPT不仅准确理解了其绘画内容,还给出了专业的点评。例如,它指出大脑的位置绘制得相当准确,并建议将大脑的形状调整得更为接近椭圆。
然而,在演示过程中,这一高级语音模式也暴露出了一些在几何问题上的不准确性,揭示了其可能产生“幻觉”的潜在风险。值得一提的是,这一带视觉功能的高级语音模式曾经历多次推迟。今年4月,OpenAI曾承诺将在“几周内”推出,但随后又表示需要更多时间来完善。直至今年秋初,该功能才首次向部分ChatGPT用户开放,但当时还尚未具备视觉分析的能力。
在人工智能领域竞争日益激烈的当下,谷歌、Meta等竞争对手也在紧锣密鼓地开发类似功能。本周,谷歌就已向部分Android测试人员开放了其实时视频分析对话式人工智能项目——Project Astra。
此外,OpenAI还在本周四推出了一个别出心裁的节日功能——“圣诞老人模式”。用户只需在ChatGPT应用中找到提示栏旁的雪花图标并点击,即可启用这一充满节日氛围的圣诞老人语音功能。