每日AI资讯-2025年10月14日-AITOP100,AI资讯

潞晨Open-Sora 2.0入选全球AI报告，开源视频模型获国际认可

近日，潞晨科技自主研发的Open-Sora 2.0视频生成模型成功入选《State of AI Report 2025》。作为全球AI领域最具影响力的年度报告之一，该报告聚焦于过去一年在科研、产业和社会层面的重大突破。此次入选，不仅是对潞晨科技在视频生成领域努力的认可，更标志着其成果正获得全球AI社区的广泛关注。

Open-Sora结合了潞晨科技强大的训练框架Colossal-AI，已在开源社区和学术圈中获得了显著认可，累计获得约7万个GitHub星标，并在同领域中排名全球第一，已有超过500篇论文引用。在分布式训练方面，潞晨科技通过优化训练方式和架构，成功减少了97%的checkpoint写盘时间，同时将整体算力成本降低了约90%，推动了技术的商业应用。

此外，Open-Sora的生态应用也备受关注，众多个人开发者和团队基于其进行快速微调，创造出多种风格的生成模型。潞晨科技还与自家产品Video Ocean联手，将视频生成能力融入更多创作者和企业的实际生产中，持续定义下一代AI视频的新标杆。

体验地址：潞晨Open-Sora网页版官网入口

Open-Sora 2.0

谷歌Nano Banana上线：Lens与AI模式新增图像编辑功能

谷歌近日正式推出了Nano Banana图像编辑功能，现已在其Gemini应用中取得了良好反响。这一强大的图像编辑与生成功能现已引入AI模式和Google Lens中，用户使用起来更加便捷。

Nano Banana功能于10月13日正式上线，目前已在美国和印度的Android和iOS用户中推出，未来还将拓展到更多国家和语言。在Android设备上，用户可通过“Circle to Search”功能直接进入AI模式。用户可访问相册、相机或使用香蕉表情符号来创建图像，并可对已有图像进行编辑。生成的图像将带有Gemini水印，用户可直接下载或分享。

Google Lens中对Nano Banana功能的整合更加显著，用户捕捉图像时可直接使用前置摄像头，并快速切换镜头。按下快门后，图像将被添加到AI模式的提示框中，用户可在此基础上输入新提示进行进一步编辑。谷歌还为AI模式新增了35种语言和超过40个国家和地区，现已支持的国家和地区总数达到了200个。

体验地址：谷歌Nano Banana网页版官网入口（海外网站需要梯子）

谷歌Nano Banana

腾讯青云奖学金启动：50万支持AI硕博科研，11月7日截止报名

2025年10月14日，腾讯推出了“青云奖学金”，为AI前沿领域的硕博学子提供科研激励。科研之路充满挑战，腾讯设立此奖学金，旨在为有天赋、有热情的年轻人提供支持，鼓励他们挑战大胆、前沿的科研方向。

首届“青云奖学金”预计评选出15位优秀学子，每人总支持高达50万元，包括20万元现金奖励和价值30万元的云异构算力资源。获奖者还有机会进入腾讯实习或就业，直接与产业实践接轨。腾讯招聘全球负责人罗海波表示，此奖学金旨在支持最具天赋和热情的青年学者，推动人工智能领域的前沿突破。

申请条件方面，要求在中国大陆及港澳台地区院校就读、具有中国国籍的硕士和博士同学，毕业时间在2027年1月及之后，来自计算机科学、人工智能及其交叉领域，具备卓越的研究能力和深厚的学术造诣。报名期为2025年10月到11月，11月07日24点截止，评选流程包括初审和答辩终审。如果你是在读硕博生，深耕相关领域，那就别犹豫，赶紧申请吧！

详情地址：腾讯重磅发布“青云奖学金”：50万现金+算力支持，AI人才培养再升级

腾讯青云奖学金

微软Copilot升级：连接邮件生成文件，办公效率大提升

微软近日对其Copilot AI助手进行了重要升级，允许用户直接连接Outlook、Gmail等多款个人生产力应用，处理日常工作任务更加高效。

这项连接器功能是可选的，用户可在设置中选择需要连接的服务。通过自然语言提示，Copilot可自动查找邮件内容，如总结同事发送的工作项目时间表，节省用户查找信息的时间和精力。此外，Copilot用户现在可通过自然语言指令创建和导出Word文档、Excel电子表格、PDF文件和PowerPoint演示文稿。用户只需简单输入提示，即可将想法、笔记和数据转换为可分享和可编辑的文档。

目前，这项升级和新连接器功能正逐步向微软Copilot的“内测者”计划成员推送。尽管该功能正在推广中，但并非所有内测者都会立刻获得更新。这一升级的推出，正值微软加大力度扩展其核心AI产品，努力将其与日常使用的生产力应用紧密结合。对于企业用户来说，这些新功能意味着可更高效地管理日常工作流程，减少在信息检索和文档制作上的时间，提升整体办公效率。

详情查看：微软Copilot重磅升级，效率飙升！智能助手连接邮件，文档创建更轻松

微软Copilot升级

抖音SAIL-VL2模型开源：小参数规模，推理能力比肩大模型

抖音SAIL团队与LV-NUS Lab强强联手，推出了SAIL-VL2多模态大模型。这款新模型在保持较小参数规模的同时，在复杂推理任务中表现优异，甚至能与更大型的闭源模型相抗衡。

SAIL-VL2的参数设置分为2B和8B，在106个数据集上实现了性能突破，尤其在MMMU、MathVista等复杂推理基准测试中表现突出。为了确保“小模型也能有强能力”，SAIL-VL2在数据、训练及架构设计上进行了创新。架构设计上引入了稀疏混合专家（MoE），优化性能和计算效率；视觉编码器SAIL-ViT采用渐进式优化，提升视觉-语言对齐能力。

数据层面上，SAIL-VL2构建了高质量的多模态语料库，确保数据的准确性和多样性。同时，团队设计了一套渐进式的训练框架，使模型在不同任务中的表现更加出色。数据显示，SAIL-VL2的8B规模模型在推理能力上已与最新的GPT-4o不相上下。SAIL-VL2的开源代码和模型已在GitHub和Hugging Face上发布，便于研究者和开发者使用与探索。

模型地址： https://huggingface.co/papers/2509.14033

抖音SAIL-VL2模型

苹果FS-DFM模型发布：长文本生成速度提升128倍，步骤仅需8轮

苹果公司与俄亥俄州立大学研究团队联合发布了FS-DFM（Few-Step Discrete Flow-Matching）模型，这一创新语言模型在长文本生成方面表现出色，写入速度可提高最多128倍。

FS-DFM模型的设计理念与主流语言模型有所不同。以ChatGPT为代表的自回归模型是逐字生成文本，而扩散模型则采用并行策略。FS-DFM在扩散模型的基础上进行了进一步简化，目标是用更少的步骤实现高质量文本的生成。为了实现这一突破，苹果研究团队提出了一套精妙的三步法，包括模型训练、引入“教师”模型进行引导以及优化迭代机制。

在性能评估中，FS-DFM对比了参数量为70亿的Dream模型和80亿的LLaDA模型。测试结果显示，即使FS-DFM的参数量仅为1.7亿至17亿，其在文本生成的困惑度和熵上表现出更低的困惑度和更稳定的熵。这一成绩证明了FS-DFM模型在AI长文本写作领域的潜力。FS-DFM模型的推出，无疑为长文本生成领域带来了新的突破。

项目地址： https://machinelearning.apple.com/research/fs-dfm

苹果FS-DFM模型

蚂蚁Ring-1T模型开源：万亿参数能解奥数题，多项测试拿第一

10月14日凌晨，蚂蚁集团正式推出了万亿参数思考模型Ring-1T，并全面开源模型权重、训练配方。Ring-1T在预览版基础上，持续扩展大规模可验证奖励强化学习（RLVR）训练，进一步激发万亿基座的自然语言推理能力。

为了持续激发Ring-1T的数学等复杂推理能力，蚂蚁百灵团队挑战了难度更高的IMO2025赛题。实验结果显示，Ring-1T仅用一次解出了多道赛题，相当于IMO银牌水平，成为首个能拿IMO国际奥数奖的开源系统。在“人类偏好对齐”测试中，Ring-1T以高成功率居于开源模型榜首。在医疗问答测评中，Ring-1T也以最高分取得开源领域最佳。

万亿参数思考模型训练最大难题是训推精度差异。在Ring-1T模型中，蚂蚁采用了自研的“棒冰”算法来应对这项行业难题，确保长序列、长周期训练不崩。此外，蚂蚁还自研了高性能强化学习系统ASystem，针对万亿参数模型的显存管理和训推权重交换问题做了精细优化。目前，用户可通过HuggingFace、魔搭社区下载模型，并通过蚂蚁百宝箱等平台在线体验。蚂蚁百灵大模型已形成从160亿总参数到1万亿总参数的大语言模型产品矩阵。

详情查看： https://www.aitop100.cn/infomation/details/30136.html

蚂蚁白灵大模型