Pruna AI 开源优化框架,助力 AI 模型“瘦身”提速
Pruna AI,这家来自欧洲的初创公司,最近搞了个大动作——把他们的 AI 模型优化框架开源啦!这意味着啥?开发者们以后压缩 AI 模型能更轻松、更高效。这个框架可不简单,它融合了缓存、剪枝、量化和蒸馏等多种技术,就像给 AI 模型来了一场全方位的“瘦身手术”。不仅能让模型体积变小,还能保证性能不下降,甚至有所提升。
Pruna AI 的联合创始人约翰·拉赫万说,他们的框架就像 Hugging Face 对 transformers 和 diffusers 的标准化一样,给各种效率方法提供了统一的调用方式。
现在,大公司都在用各种压缩方法,但开源社区里很难找到这么全面的解决方案。Pruna AI 的这个框架,支持多种类型的模型,特别是图像和视频生成模型。已经有不少企业在用了,反馈还不错。而且,他们还有个企业版,提供更多高级功能,按小时收费,用起来挺划算。

百度华为联手,推出 AI 搜索新模式“百看计划”
百度和华为鸿蒙联手啦!他们推出了一个全新的 AI 搜索模式,叫“百看计划”。这个计划可是为鸿蒙系统的用户量身打造的,旨在提供更智能、更便捷的搜索体验。百度用上了先进的 AI 技术,让搜索变得更个性化、更精准。这个计划不仅技术上有创新,还在用户体验、内容和生态建设上做了全面重构。
通过深度学习技术,它能更好地理解用户的搜索意图,给出更精准的搜索结果。华为也发布了新形态手机,配合百度的 AI 搜索功能,让鸿蒙系统的生态建设更加丰富。这下,鸿蒙系统的用户有福啦,搜索体验肯定大不一样!

杭州群核科技开源新模型,让机器人秒懂 3D 世界
杭州的群核科技最近可是火了一把,他们开源的空间理解模型 SpatialLM 被谷歌点名感谢。这个模型可厉害了,能让机器人通过一段普通视频就理解物理世界的几何关系。简单来说,就是机器人能“看”懂 3D 世界了。
SpatialLM 能把手机拍摄的视频转化成三维空间布局信息,生成详细的 3D 场景。这样一来,机器人训练的成本就大大降低了,效率也提高了不少。
在 GTC2025 大会上,群核科技还展示了他们的虚拟训练平台 SpatialVerse,让机器人在模拟环境中进行训练,形成从认知到行动的完整闭环。这项技术让机器人能像人类一样理解和处理复杂的环境变化,未来在机器人训练领域肯定大有可为。
详情请点击《SpatiaILM模型地址》

阶跃星辰开源图生视频模型,运动幅度可控超灵活
上海阶跃星辰智能科技有限公司开源了他们的图生视频模型——Step-Video-TI2V。这个模型可不一般,它能生成 102 帧、5 秒、540P 分辨率的视频,而且运动幅度和镜头运动都可控,动漫效果还特别出色。
开发团队在模型里做了两大关键优化,一是引入图像条件提高生成视频与原图的一致性,二是通过 AdaLN 模块引入视频动态性打分信息,让用户可以指定不同的运动级别。
这样一来,用户就能根据自己的创作需求自由切换动态与稳定画面,生成各种运镜效果的视频。这个模型在动漫类任务上表现尤为突出,非常适合动画创作和短视频制作。而且,它还支持多种尺寸的图生视频,满足不同平台的需求。

谷歌 Chrome 浏览器整合 Gemini AI 助手,操作更便捷
谷歌 Chrome 浏览器又要迎来新变化啦!谷歌计划把 Gemini 人工智能助手深度整合进 Chrome 浏览器,让用户享受更便捷的在线体验。整合后的 Gemini AI 助手就像 Edge 浏览器中的 Copilot 功能一样,用户可以在浏览器窗口前端看到它的图标,点击就能启动助手。谷歌还提供了自定义快捷键的选项,让用户可以根据自己的习惯设置快捷键。
除了这些,Gemini AI 助手在 Chrome 的后台支持下,还允许用户启用系统托盘图标,从任务栏直接调用助手。不过,目前 Gemini 还不支持类似 Copilot 的侧边栏固定模式,用户需要适应一下。这一变化让 Chrome 浏览器功能更丰富,用户的上网体验也更有趣、更便利了。

腾讯混元推出全新推理模型 T1,技术再升级
腾讯混元又有新动作啦!他们旗下的全新推理模型 T1 将于 3 月 21 日晚正式发布。这可是腾讯在人工智能大模型领域的又一次重要技术迭代和产品升级。与此同时,腾讯混元大模型还首次成功登上 Chatbot Arena 排行榜,并跻身全球 Top15 行列。这个排行榜可是备受认可的,能登上榜单说明腾讯混元的技术实力已经达到国际领先水平。
全新推理模型 T1 的发布,无疑会进一步提升腾讯混元在全球大模型竞争格局中的地位。外界都期待 T1 模型能在推理能力上带来新的提升,让腾讯混元在人工智能领域走得更远。

OpenAI 推出升级版 AI 模型 o1-pro,价格昂贵引关注
OpenAI 最近推出了一款全新的“推理”AI 模型——o1-pro。这个模型可是投入了大量计算资源的,旨在提供“始终如一的更优响应”。不过,这个高性能模型目前只面向部分特定开发者开放,而且价格昂贵得让人咋舌。输入文本的费用是每百万 token 150 美元,生成文本的费用更是高达每百万 token 600 美元。
这个价格可是普通 o1 模型生成价格的十倍!尽管价格不菲,OpenAI 还是对 o1-pro 的性能寄予厚望。不过,早期用户对 o1-pro 的印象褒贬不一,有用户反映它在解决数独谜题时表现不佳。OpenAI 正试图通过投入更高的计算成本来提升 AI 模型在复杂任务中的性能和可靠性,但开发者是否愿意为这种性能提升付出高昂代价,还有待市场检验。








