Veo3.1重磅升级:多图一致性跃升与原生4K竖版支持
2026年1月14日,Veo3.1迎来重大更新,核心聚焦于Ingredients to Video(多图参考生视频)、原生竖版输出及4K 超分能力。本次升级显著提升了角色与背景的视觉一致性,支持直接生成适配短视频平台的 9:16 画面,并通过先进超分技术提供 1080p 与 4K 专业级画质。目前,新功能已在 Gemini app、Flow、Gemini API、Vertex AI 及 YouTube Shorts/Create 等渠道陆续上线,标志着 AI 视频从演示走向实用生产。
Veo3.1 的核心功能“Ingredients to Video”(素材生视频)支持用户同时上传最多三张参考图像——可以是人物肖像、场景背景或物体纹理——结合简短的文本描述即可生成动态视频内容。此次更新最大的突破在于跨场景视觉一致性的显著提升:同一角色在不同镜头中保持身份稳定,背景元素和材质纹理可无缝复用,有效解决了以往 AI 视频中常见的“人脸变形”“物体漂移”“场景跳戏”等顽疾。
VEO全系列工具体验: https://www.aitop100.cn/ai-video-generator/veo-text2video
查看详情:Veo3.1重磅升级:多图一致性跃升与原生4K竖版支持

京东物流春节重磅出击:行业首个“AI年货地图”免费开放
基于京东多年积累的消费数据与AI算法模型,“AI年货地图”可对全国各地区、各品类的年货销量进行高精度预测。商家通过系统可提前了解不同区域的消费需求,将商品精准调配至距离消费者最近的仓储节点,实现“订单未下,货已先行”的履约模式,大幅缩短配送时间。
系统为商家提供全链路库存管理服务,实时展示全国库存分布、周转天数、平均履约时长等核心数据。商家可通过可视化看板动态调整补货策略,避免库存积压或断货风险,提升运营效率。
京东物流透露,通过“AI年货地图”的智能调度,春节前商家跨区发货的比例有望控制在1%以内。这一突破将显著降低物流成本,同时减少因长途运输导致的配送延迟,提升消费者体验。
查看详情:京东物流春节重磅出击:行业首个“AI年货地图”免费开放,助力商家高效备战年货季

中国首个AI商业信任协议ACT发布,支持多平台智能体一站式办事
1月16日,支付宝携手千问App、淘宝闪购、Rokid、大麦、阿里云百炼等合作伙伴,共同发布了中国首个面向Agent商业需求的开放技术协议框架——ACT协议(Agentic Commerce Trust Protocol,智能体商业信任协议)。
这一协议的推出,标志着AI与电商、外卖等服务平台协同进入了一个全新的阶段,为跨终端、跨系统、跨平台的AI任务执行提供了“通用语言”,让AI服务更加便捷、高效。
以千问App为例,依托ACT协议,千问成功打通了淘宝闪购与支付宝AI付的链路。用户只需向千问发出指令“帮我点杯珍珠奶茶”,千问便能基于用户地理位置,智能推荐附近符合需求的商品,并同步完成比价与优惠券自动核销。
用户仅需点击“选它”,确认支付宝付款,即可一键完成结账。整个购物流程以对话式、自动化、不跳端的方式推进,千问化身专属“购物助手”,包办了繁琐操作。
查看详情:中国首个AI商业信任协议ACT发布,支持多平台智能体一站式办事

腾讯混元3D Studio 1.2公测开启:笔刷交互与八视图生成,引领3D建模新高度
今日,腾讯腾讯混元3D公众号官方正式宣布,旗下备受瞩目的3D生成平台——混元3D Studio已全面升级至1.2版本,并面向所有用户开放公测。此次升级不仅显著提升了3D资产生成的专业性和可控性,更让用户无需繁琐申请,即可直接体验这一前沿技术的魅力。
在组件生成能力方面,混元3D Studio 1.2版本集成的PartGen工具也迎来了重大升级,现已更新至1.5版本。其核心拆分精度从原先的10243分辨率提升至惊人的15363,这一改进使得模型细节得以更完整地保留,为专业设计师提供了更为精细的建模基础。
工具地址:腾讯混元3D网页版官网

美团LongCat-Flash-Thinking-2601震撼开源:工具调用与推理能力双突破
今日,美团旗下的 LongCat 团队正式宣布推出并开源其最新力作——LongCat-Flash-Thinking-2601。作为 LongCat-Flash-Thinking 系列的升级版本,这一模型在智能体搜索、工具调用以及推理能力等多个核心评测基准上,均达到了当前开源模型的顶尖水平(SOTA),无疑为开源社区注入了一股强劲的新动力。
LongCat-Flash-Thinking-2601 的核心亮点在于其出色的工具调用能力。在面对依赖工具的复杂任务时,该模型展现出了非凡的适应性和灵活性,能够迅速理解并调用合适的工具完成任务。
这一特性不仅显著提升了模型在真实场景中的应用价值,还大幅降低了对新工具进行适配训练的成本,为开发者提供了更为便捷、高效的开发体验。
查看详情:美团LongCat-Flash-Thinking-2601震撼开源:工具调用与推理能力双突破

Opera AI上线:侧边栏智能体与上下文感知重塑浏览体验
全球浏览器创新领军者 Opera 今日正式宣布上线 Opera AI,作为 Aria 的继任者,它将以全新的侧边栏形态登陆 Opera One、Opera GX 及 Opera Air。基于源自 Opera Neon 的智能体引擎,响应速度提升约20%。Opera AI 不仅具备深度上下文感知能力,能精准理解当前网页与标签页内容,还支持语音输入、视频摘要及表格文档等全能文件分析。更重要的是,它引入了严格的隐私保护机制,仅在用户明确允许时才访问当前页面数据,真正做到 “懂网页,更懂边界”。
秉持 “浏览器即 AI 接口” 的核心战略,Opera AI 并非简单的工具叠加,而是旨在打造一种与浏览行为无缝融合的共生体验。作为 Aria 的强力继任者,它常驻于浏览器侧边栏,用户无需离开当前页面即可随时调用。
这种 “侧边栏智能体” 形态打破了传统标签页切换的割裂感,无论是复杂的资料调研还是即时的长文总结,用户都能在浏览的同时获得 AI 的实时辅助。得益于底层智能体引擎的重构,20%的响应速度提升让这种并行协作更加流畅自然。
查看详情:Opera AI上线:侧边栏智能体与上下文感知重塑浏览体验

1.2 万平方米AI机器人盛宴空降安庆:人形与教育机器人齐亮相
一场融合科技与艺术的 “AI 机器人科技展” 在安庆会展中心拉开帷幕。展览面积达 1.2 万平方米,汇聚竞技、教育、特种作业及人形机器人,设有多维舞台秀与沉浸式互动区。此次盛会不仅让青少年零距离体验前沿科技,更旨在通过科普连接产业,打造全民参与的未来科技嘉年华。
本次展览由安庆市新闻传媒中心等单位联合主办,上海深空纪元科技有限公司承办,以 “触摸未来·AI 同行” 为核心愿景。作为安庆近年来规模最大的人工智能主题科普活动,展会突破了单纯的技术陈列模式,致力于打造一个集 “浏览 + 互动 + 科普” 于一体的综合性平台。主办方旨在通过高沉浸感的互动设计,建立公众与前沿科技的连接,填补区域高端科技展的空白。









