智谱新推GLM-4-Air、GLM-4V-Plus模型,免费全模态模型Flash亮相
北京智谱华章科技于2025年1月16日推出了GLM-4-Air、GLM-4V-Plus等新模型,并在bigmodel.cn平台上线。继推出“智谱清言”后,公司继续深耕多模态领域,带来GLM-Realtime等创新模型。
GLM-Realtime是一款全新端到端模型,具备视频理解与语音交互的低延迟特性,新增清唱功能,并能记忆2分钟内的内容,支持Function Call功能。同时,GLM-4-Air和GLM-4V-Plus模型得到升级,提供更高效的语言模型解决方案。为回馈社会,智谱设立了免费的Flash全模态模型,覆盖多种应用场景,助力开发者创新。
GLM-Realtime在视频通话中能记忆2分钟内容,创新实现清唱功能,增强了对话中的歌唱能力。该模型已集成到智能眼镜和陪伴娃娃中,提供近似实时的智能交互。此外,Realtime API支持Function Call,可灵活调用外部知识,拓展商业应用,现已在智谱开放平台免费提供。
GLM-4-Air升级为GLM-4-Air-0111,性能提升,价格减半,降低应用门槛。GLM-4V-Plus也全面升级,支持变分辨率功能,适应不同尺寸图像,大幅降低token消耗,支持4K超清图像和极端长宽比图像识别,具备2小时的视频理解能力。
智谱致力于普惠大模型技术,推出行业首个全模态免费系列模型Flash,包括语言、图像理解、生成等多模态功能。Flash系列即将全面升级,涵盖GLM-4-Flash、CogView-3-Flash、CogVideoX-Flash等多款模型,免费开放给全社会使用。
阶跃星辰推出新型推理模型Step Reasoner mini,实现文理双全能力
2025年1月16日,上海阶跃星辰智能科技推出了一款新型推理模型——Step Reasoner mini(简称Step R-mini),现已在跃问网页端正式上线。作为Step系列的首个推理模型,Step R-mini专注于提供精准的逻辑推理和创意内容创作。
Step R-mini具备超长推理能力,能够解决数学、代码等复杂问题,并在文学创作等领域也表现出色。该模型在数学基准测试AIME和Math上超越o1-preview,与OpenAI o1-mini媲美,在LiveCodeBench代码任务上也展现了优异性能。通过大规模强化学习训练,Step R-mini实现了文理兼顾,既能解答复杂数学问题,也能进行创意文学创作。
在实际应用中,Step R-mini在数学、逻辑推理、代码编写和内容创作等方面表现卓越。它能构建合理的推理链解决奥数难题,通过草图辅助几何题目解答,并在代码题上能应对高难度挑战。在内容创作方面,Step R-mini能够深入理解用户需求,创作出富有情感和个性化的作品。
此外,阶跃星辰还在开发视觉推理模型,将推理能力扩展到视觉领域。该模型利用慢感知和空间推理,实现了视觉空间下的Spatial-Slow-Thinking,预计将于今年推出正式版本。Step R-mini的上线,标志着阶跃星辰在推理模型领域的又一重要进展。
阶跃星辰AI视频工具地址:【点击查看】
腾讯会议升级版发布,AI小助手Pro强势登场
腾讯会议近日迎来重大更新,推出了AI小助手Pro,并对会议协同功能进行了深度优化。AI小助手Pro基于腾讯的混元大模型,能够智能理解并迅速回应会议内容,提供精准的会议支持。它能在线搜索、处理文件和图片提问,还能辅助文案创作、报告解读等。
腾讯会议此次升级还包括了会议通知和录制分享的改进。用户可在应用内创建组织,轻松预定会议并同步日程,提高了会议组织效率。新增的云录制分享功能,使得会议内容的分享更加安全便捷。
此外,腾讯会议还增加了个人和企业认证功能,为专业版及以上用户提供更专业的会议体验,增强了会议的安全性。这次升级无疑为用户带来了更高效、更安全的会议体验。
Gmail更新:安卓用户专享新‘插入’按钮,Gemini邮件回复更便捷
谷歌近日为Gmail安卓用户带来了一项贴心升级,新增了一个“插入”按钮,极大简化了利用Gemini AI回复邮件的操作。自去年8月推出Gemini功能以来,用户虽能轻松总结邮件、自动生成回复,但在手机上的使用体验并不理想,需手动复制粘贴生成内容。
现在,安卓用户只需点击新添的“插入”按钮,Gemini的回复就能直接嵌入邮件回复框,方便用户进一步编辑。这一按钮位于界面右下角,与“赞”和“踩”按钮并列,让邮件回复更加流畅。
除了邮件回复,Gemini还能帮助用户从Google Drive检索信息,快速筛选邮件,获取日历事件详情,甚至总结邮件线程或在日历中创建事件。这些功能大大提升了工作效率。如果你尚未见到这个新按钮,它可能很快就会出现在你的设备上。
微软AutoGen v0.4升级:AI代理框架灵活性增强,支持跨语言操作
微软最新发布了AutoGen v0.4,这是其AI代理编排框架的重要更新。此次升级显著提高了AI代理的灵活性和跨语言能力,解决了早期版本中的一些限制和效率问题。
自推出以来,AutoGen因其架构限制和API效率问题受到了开发者的挑战。v0.4版本针对这些问题进行了优化,引入了异步消息传递机制,允许代理支持事件驱动和请求交互模式,极大地提升了开发灵活性。新版框架的模块化和可扩展性,使得创建长期运行和复杂分布式代理网络变得更加容易。
AutoGen v0.4还加强了多代理团队的管理,并为开源开发者提供了更优质的扩展功能。内置的指标追踪、消息追踪和调试工具,增强了用户对代理互动的监控能力。
跨语言互操作性是该版本的一大亮点,目前支持Python和.NET,未来将扩展至更多编程语言。微软对AutoGen进行了架构重构,明确了框架、工具和应用程序的职责划分,形成了清晰的三层结构。
同时,AutoGen Studio也得到了升级,这个低代码界面让代理的原型设计更加快捷。用户可以实时更新代理,暂停对话或重新引导代理,通过直观的拖拽界面设计代理团队。
自2023年10月推出以来,微软不断优化AutoGen,简化代理间的沟通。随着AI代理技术的进步,微软还推出了其他系统如Magentic-One,构建了一个强大的AI代理生态系统。与此同时,Salesforce、ServiceNow和AWS等竞争对手也在努力提升自家代理系统,以跟上微软的步伐。
马斯克旗下xAI推出网页版Grok AI,开放使用无需X账户
xAI公司,隶属于马斯克旗下,近日推出了网页版的Grok AI聊天机器人,这一动作不仅丰富了产品功能,也极大提升了用户体验。现在,用户无需X账户即可直接在grok.com上注册并使用Grok AI的多样化服务,展现了xAI在AI领域的雄心和实力。
注册过程简单快捷,只需在网站上输入出生年份即可。Grok AI具备实时信息搜集、问题解答甚至图像生成等功能,满足不同用户需求。用户可通过下拉菜单轻松切换不同模式,以获得更灵活的AI响应。
与iOS版本一样,网页版Grok AI也不要求用户拥有X账户。用户可通过Google账户或电子邮件轻松注册。Grok还提供了免费计划,尽管有一定功能限制,如每两小时生成10张图像或每天3次图像分析。
注重隐私保护,Grok推出了“临时模式”,在此模式下,用户的聊天记录不会被保存或用于训练模型。这一功能特别适合对隐私敏感的用户。网站右上角的幽灵图标方便用户开启“临时模式”,并提供聊天历史和设置链接。
在实测中,Grok AI的图像生成功能表现出色,仅用18.18秒便生成了4张高质量图像,这样的流畅体验无疑会吸引更多用户。
Grok网页版的推出,为用户提供了更便捷、灵活的AI体验,扩大了用户基础,并丰富了互动方式。这一创新举措预计将使Grok在激烈的AI市场竞争中更具竞争力。
Luma AI 发布Ray2视频生成模型,带来更快速和自然的动态效果
Luma AI近日在其Dream Machine平台上推出了革命性的视频生成模型Ray2,这一技术进步在AI视频制作领域引起了轰动。自去年夏天Dream Machine首次亮相以来,AI视频技术飞速发展,Ray2的推出代表了Luma AI在视频生成领域的重大突破。
联合创始人兼CEO Amit Jain指出,Ray2的计算训练量是前代Ray1的十倍,实现了快速、自然且一致的运动和物理效果。这一提升大幅提高了生成高质量视频的效率,让视频创作变得更加便捷。
Ray2目前主打文本到视频的生成功能,用户输入描述后,可快速生成5至10秒的视频。尽管需求高时生成时间可能延长,但Ray2的快速响应仍受到用户好评。
Luma AI展示的示例视频展现了Ray2的强大能力,如南极暴风雪中的奔跑者、北极冰面上的芭蕾舞者,动作流畅自然,远超其他AI视频的动态表现。
用户对Ray2的反响热烈,社交媒体上对其摄影效果、照明和真实感赞不绝口。尽管复杂提示可能导致生成内容不够自然,但总体评价积极。
Ray2初期仅对Dream Machine的付费订阅者开放,以控制排队时间。未来将推出图生视频和更长视频的功能。为庆祝Ray2发布,Luma Labs举办了大奖赛,奖金高达7000美元,鼓励创作者参与。
此外,Luma Labs还启动了联盟计划,允许参与者通过推广工具赚取佣金,旨在激励更多创作者探索新技术。参赛作品需在1月22日前提交,获奖者将于1月27日公布。
更多AI行业最新资讯新闻信息请关注AI人工智能网站--AITOP100平台--AI资讯专区:https://www.aitop100.cn/infomation/index.html