![](/assets/avatar-d01f8776.png)
2024-05-14 09:48:35
每日AI资讯--5月14日
ChatGPT将变身AI语音助手?挑战Siri和谷歌语音助手
来源:36氪
当地时间5月11日,人工智能巨头OpenAI CEO山姆·奥特曼在一档播客节目中称,OpenAI将继续改进并提升ChatGPT的语音功能质量,并表示相信语音交互是通向未来交互方式的一个重要途径。奥特曼称:“多模态交互能力非常强大,比如可以问:‘嘿,ChatGPT,我正在看什么’或‘我不太确定这是哪种植物。’”据外媒报道,OpenAI正在研发的功能是人工智能语音助手,可以与苹果Siri和谷歌语音助手竞争。(澎湃)
OpenAI全能模型GPT-4o发布 能听能看能说还免费
来源:站长之家
OpenAI 最新发布了其旗舰大模型 GPT-4o,该模型不仅免费可用,还具备听、看、说的综合能力,提供丝滑流畅且无延迟的交互体验,仿佛与人进行视频通话一般。
GPT-4o 的特点
全能输入输出:GPT-4o 能够接受文本、音频和图像的任意组合作为输入,并生成相应的文本、音频和图像输出
快速响应:该模型响应音频输入的时间仅为232毫秒至320毫秒,与人类对话反应速度一致
免费开放:GPT-4o 将对所有用户免费开放,包括 ChatGPT Plus 会员版所有的功能,如视觉、联网、记忆、执行代码等
OpenAI发布会-AGI已来
来源:AI TOP100
1.实时语音问答,并赋予感情交流。
2.通过摄像头视觉传达内容(文字/图形)
3.捕捉桌面信息进行辅助编程与问答
4.通过视觉解析图形报表,总结分析
5.视频通话可实时翻译,支持多国语言
谷歌发布新型时间序列预测模型TimesFM 可预测股市、天气等
来源:站长之家
Google Research最近开发了一种创新的时间序列预测模型,名为TimesFM(Time Series Foundation Model)。这项技术能够利用大量历史数据来学习事件的模式和趋势,进而对新的、未见过的数据做出准确的预测。时间序列预测在商业、金融、科研等多个领域都极为重要,能够帮助人们做出更明智的决策。
阿里开源视频自动化剪辑工具FunClip 支持中文语音识别
来源:站长之家
阿里巴巴通义实验室最近开源了一款名为FunClip的视频自动化剪辑工具,专为精准和便捷的视频切片设计。FunClip能够自动识别视频中的中文语音,并允许用户根据语音内容裁剪视频,大大提高了视频编辑的效率。
项目地址:https://github.com/alibaba-damo-academy/FunClip
项目地址:
https://modelscope.cn/studios/iic/funasr_app_clipvideo/summary
OpenAI抓内鬼出奇招:宣布升级GPT-4而非推出GPT搜索引擎
来源:阿杰与AI
OpenAI近期宣布将在5月13日举行发布会,但意外地不是推出GPT-5或GPT搜索引擎,而是升级ChatGPT和GPT-4。这一举动让人猜测是否与内部泄密有关。已有知名爆料者透露,OpenAI已开除至少一名内鬼,并且有其他员工被开除或离职,包括一些安全对齐团队的成员。虽然具体升级内容未知,但有猜测称可能涉及语音助手、GPT-4轻量级版、大量Agents应用或与苹果合作等方面。这一举动引起了广泛关注,OpenAI的未来走向备受期待。
魅族 21 Note 支持 AI 通话摘要功能:将于5月16日发布
来源:站长之家
魅族今日正式揭晓了其全新旗舰魅族21Note手机的一大亮点——AI通话功能。这一功能不仅支持通话内容摘要及待办事项整理,更具备笔记记录和全局录音的实用特性,为用户带来前所未有的通话体验。
除了先进的AI通话功能,魅族21Note在硬件配置上也毫不逊色。它搭载了高达5500mAh的电池,据官方介绍,这一大容量电池足以支持长达12.8小时的高强度使用。屏幕方面,魅族21Note采用了一块1.5K144Hz的OLED护眼直屏,使用U8发光材质,并支持全场景LTPO技术,为用户带来流畅且舒适的视觉享受。
分享
0
0
![](/assets/avatar-d01f8776.png)
全部评论
加载更多
热门内容