• 首页
  • AI工具集
  • AI资讯
  • AI活动
  • AI社区
  • AI短剧
  • AI创作大赛
  • AI小说
  • AI绘画
    AI视频
    AI对口型
    视频转动漫风格
    AI创意二维码
    AI艺术字
    AI智能抠图
  • AI漫剧创作热门-AI社区
AI 对话

微软Agent Lightning正式上线:无需重构,LLM性能飞跃!

微软Agent Lightning正式上线:无需重构,LLM性能飞跃!
AI TOP100
11小时前

在AI技术蓬勃发展的当下,各大科技巨头都在不断推陈出新,力求在AI领域占据一席之地。2025年10月29日,微软正式上线了Agent Lightning这一开源框架,它宛如一颗重磅炸弹,在AI圈掀起了巨大波澜。这一框架究竟有何独特之处?难道它不能为强化学习训练大规模语言模型带来新的变革吗?与以往的传统框架相比,Agent Lightning无疑是更具创新性和实用性的存在。

Agent Lightning

Agent Lightning:强化学习训练的“秘密武器”

Agent Lightning的核心目标是通过强化学习(RL)来优化多代理系统。在不改变现有代理架构的前提下,它能够将真实代理行为转化为RL过渡,进而提升策略大规模语言模型(LLM)的性能。这就好比给一辆旧车换上了更强劲的发动机,在不改变车身外观的情况下,让车的性能得到了质的飞跃。

该框架把代理建模成一个决策过程,具体而言,它将代理形式化为部分可观测的马尔可夫决策过程。代理的观察就是当前输入,行动是模型调用,奖励则分为终极奖励和中间奖励。它能够提取代理模型的调用记录,以及输入、输出和奖励信息,就像一个精准的过滤器,过滤掉多余的噪声,生成用于训练的干净过渡数据。这样一来,训练出的模型会更加精准和高效。

创新设计:“训练代理解耦”与便捷接口

Agent Lightning采用了“训练代理解耦”的创新方法。由Lightning Server负责训练和服务,还提供了与OpenAI兼容的API接口,这使得更新后的模型调用变得十分便捷。而Lightning Client则负责在现有的代理运行时捕获调用记录,并将数据实时传回服务器。这种设计巧妙地保持了工具、浏览器和其他依赖关系的紧密集成,同时将GPU训练放在服务器层,大大提高了训练的效率和稳定性。

打个比方,Lightning Server就像是工厂的加工车间,负责产品的生产和组装;而Lightning Client则像是工厂的原材料采集员,负责收集生产所需的原材料并及时送到车间。两者相互配合,共同完成模型的训练任务。

Agent Lightning

灵活追踪:多种路径满足不同需求

Agent Lightning支持两种追踪路径,为用户提供了更多的选择。默认路径使用OpenTelemetry进行数据收集,这种方式方便将代理的遥测信息传送至标准收集器。对于那些不想部署OpenTelemetry的团队,还有轻量级的嵌入式追踪器可供选择。最终,所有数据都会存储在同一位置,以便后续的训练使用。这就好比有两个不同的快递渠道,一个适合大规模的货物运输,另一个适合小件物品的快速送达,用户可以根据自己的实际情况选择最合适的渠道。

在AI技术飞速发展的今天,数据收集和追踪的重要性不言而喻。Agent Lightning提供的这两种追踪路径,充分考虑了不同用户的需求,体现了其设计的灵活性和人性化。

实验验证:三项任务展现稳定提升

为了验证Agent Lightning的有效性,研究团队进行了三项任务的实验,分别是文本转SQL、检索增强生成和数学问答。在文本转SQL任务中,使用了Spider基准,涵盖了超过10,000个问题和200个数据库;检索增强生成利用了MuSiQue基准,建立在包含2100万文档的维基百科规模索引上;数学问答则使用了Calc X数据集,通过工具调用进行计算。

值得一提的是,随着AI技术在各个领域的广泛应用,这些实验任务具有很强的代表性和实用性。每项任务的训练均显示出稳定的奖励提升,这充分证明了Agent Lightning在实际应用中的有效性和可靠性。

微软推出的Agent Lightning框架为强化学习训练大规模语言模型带来了新的思路和方法。它的开源特性也将吸引更多的开发者和研究人员参与其中,共同推动AI技术的发展。

相信在未来,Agent Lightning会在更多的领域发挥重要作用,为我们带来更多的惊喜。


想了解AITOP100平台其它版块的内容,请点击下方超链接查看

AI创作大赛 | AI活动 | AI工具集 | AI资讯专区

AITOP100平台官方交流社群二维码:

aitop100官方交流30群

0
0
文章来源:AI TOP100
免责声明:本文不代表本平台立场,且不构成投资建议,请谨慎对待。
全部评论
暂无评论
相关资讯
  • 微软Agent Lightning正式上线:无需重构,LLM性能飞跃!

  • 突发!OpenAI Sora取消邀请码!美、加、日、韩用户狂喜!

  • TikTok放大招!AI剪辑神器+90%分成,短视频创作要变天?

  • Genspark Hub发布:终结文件混乱,让工作井然有序

  • OpenAI IPO估值剑指万亿美元!或迎AI时代“成人礼”,下一个英伟达?

热点资讯

Vidu Q2重磅升级:AI视频生成提速3倍,5分钟长片创作成现实

9天前
Vidu Q2重磅升级:AI视频生成提速3倍,5分钟长片创作成现实

颠覆性突破!DeepSeek-OCR上线"视觉记忆压缩",AI长文本处理难题要被破解了?

9天前
颠覆性突破!DeepSeek-OCR上线"视觉记忆压缩",AI长文本处理难题要被破解了?

DeepSeek模型横扫港大美股交易赛,年化回报率10.61%碾压全球AI对手

2天前
DeepSeek模型横扫港大美股交易赛,年化回报率10.61%碾压全球AI对手

美团LongCat-Video上线,5分钟长视频生成不再是梦!

3天前
美团LongCat-Video上线,5分钟长视频生成不再是梦!

Adobe Firefly Image5发布:支持400万像素原生生成与分层编辑

1天前
Adobe Firefly Image5发布:支持400万像素原生生成与分层编辑
分享
0
0

欢迎来到AI Top100!我们聚合全球500+款AI智能软件,提供最新资讯、热门课程和活动。我们致力于打造最专业的信息平台,让您轻松了解全球AI领域动态,并为您提供优质服务。

合作伙伴
联系我们
加入AITOP100社群
加入社群
AITOP100商务微信
商务微信
相关链接
服务及隐私政策
网站地图
关于我们
粤ICP备2022124843号-2粤公网安备44030002004505广播电视节目制作经营许可证:(粤)字第00712号Copyright © 华强方特(深圳)动漫有限公司 版权所有