OpenAI正式推出ChatGPT实时视频功能，兑现七个月前演示承诺-AITOP100,AI资讯

OpenAI于本周四宣布，其针对ChatGPT所研发的“高级语音模式”，这一模拟人类对话的功能，已经成功实现了视觉化升级。对于订阅了ChatGPT Plus、Team或Pro服务的用户而言，他们现在仅需通过手机摄像头对准任意物体，便能获得ChatGPT近乎即时的反馈与互动。

这一融合了视觉技术的高级语音模式，还额外具备了屏幕共享的强大功能。无论是解析复杂的设置菜单，还是为数学问题提供解答建议，它都能轻松应对。

操作方式也极为简便：用户只需在ChatGPT的聊天栏旁轻触语音图标，随后点击左下角新增的视频图标，即可开启视频互动。若需要共享屏幕内容，也只需点击三点菜单，并选择“共享屏幕”选项即可。

关于这一功能的推广计划，OpenAI表示，带视觉的高级语音模式将从本周四起逐步推出，并预计在下周内完成全面覆盖。但值得注意的是，并非所有用户都能立即享受到这一升级服务。ChatGPT Enterprise和Edu的用户需要耐心等待至明年1月，而欧盟、瑞士、冰岛、挪威以及列支敦士登等地区的用户，则还需等待进一步的时间安排通知。

在最近一期的CNN“60分钟”节目中，OpenAI总裁Greg Brockman向主持人Anderson Cooper亲自展示了高级语音模式的视觉分析能力。当Cooper在黑板上勾勒出人体部位时，ChatGPT不仅准确理解了其绘画内容，还给出了专业的点评。例如，它指出大脑的位置绘制得相当准确，并建议将大脑的形状调整得更为接近椭圆。

然而，在演示过程中，这一高级语音模式也暴露出了一些在几何问题上的不准确性，揭示了其可能产生“幻觉”的潜在风险。值得一提的是，这一带视觉功能的高级语音模式曾经历多次推迟。今年4月，OpenAI曾承诺将在“几周内”推出，但随后又表示需要更多时间来完善。直至今年秋初，该功能才首次向部分ChatGPT用户开放，但当时还尚未具备视觉分析的能力。

OpenAI正式推出ChatGPT实时视频功能，兑现七个月前演示承诺

在人工智能领域竞争日益激烈的当下，谷歌、Meta等竞争对手也在紧锣密鼓地开发类似功能。本周，谷歌就已向部分Android测试人员开放了其实时视频分析对话式人工智能项目——Project Astra。

此外，OpenAI还在本周四推出了一个别出心裁的节日功能——“圣诞老人模式”。用户只需在ChatGPT应用中找到提示栏旁的雪花图标并点击，即可启用这一充满节日氛围的圣诞老人语音功能。

更多实用AI工具推荐请关注AI人工智能网站--AITOP100平台--AI工具集