腾讯混元翻译模型Hunyuan-MT-7B重磅开源,国际赛事斩获30项冠军
近日,腾讯宣布其混元翻译模型Hunyuan-MT-7B正式开源。这一轻量级模型参数量仅7亿,却具备强大翻译能力,支持33种语言及5种民汉语言和方言互译。
在国际计算语言学协会(ACL)WMT2025比赛中,Hunyuan-MT-7B表现惊艳,在31种语言赛事里拿下30个第一名,涵盖常见语种及捷克语、马拉地语等小语种。即便模型参数规模受限,它仍超越诸多参数更大的模型,这得益于其能更好理解对话背景与上下文,可精准翻译俚语、古诗、社交对话缩写等复杂文本。
除了Hunyuan-MT-7B,腾讯还推出Hunyuan-MT-Chimera-7B翻译集成模型,能根据多种译文生成更优质结果,支持接入其他模型,适合专业翻译场景。
Hunyuan-MT-7B优势不仅在翻译效果,计算效率和部署友好性也出色。它推理速度更快,在相同硬件下可处理更多翻译请求,且基于腾讯自研的AngelSlim大模型压缩工具,推理性能提升30%。目前,该模型已在腾讯会议、企业微信、QQ浏览器等业务中应用,提升用户体验。腾讯自2023年推出混元就积极开源,未来还将开放更多模型和技术,携手共建开放大模型生态。
腾讯开源混元世界模型Voyager,实现单图生成3D世界,登顶WorldScore排行榜
腾讯AI研究团队Hunyuan又有大动作,其开源的HunyuanWorld-Voyager引发全球AI与3D技术领域热议。作为具备原生3D重建能力的超长程世界模型,它在WorldScore排行榜上登顶,超越Gen-3等竞品。
该模型最大亮点是原生3D重建,一张图像就能生成与世界一致的3D点云,省去传统复杂前处理步骤,能高效捕捉图像几何和语义细节,在游戏开发、VR、数字内容创作等领域潜力巨大。
在相机控制方面,它表现出色。用户可自定义相机路径,模型能生成几何一致的3D场景,保持空间连贯性,还支持实时生成精确对齐的深度信息和RGB视频,提升开发效率。
HunyuanWorld-Voyager应用场景广泛,游戏开发中可快速生成可交互3D世界,缩短开发周期;VR领域能提供逼真虚拟体验;在机器人导航、自动驾驶和AR等前沿领域也有出色表现。
此次开源是腾讯2025年开源计划重要一环,此前已开源多款3D生成模型。HunyuanWorld-Voyager的发布巩固了腾讯在全球AI竞赛中的领先地位,其开放模式也对抗了西方封闭生态垄断,推动3D内容创作民主化。
详情查看:腾讯开源混元世界模型Voyager
腾讯优图开源Youtu-Agent,为AI智能体开发添新动力
2025年9月2日,腾讯优图实验室宣布开源Youtu-Agent框架,这是一款专为构建、运行和评估自主AI智能体设计的模块化框架,面向全球开发者开放。
Youtu-Agent在多项挑战性基准测试中表现卓越,采用DeepSeek-V3等开源模型,在WebWalkerQA测试准确率达71.47%,在GAIA文本验证子集达72.8%,创开源智能体框架新纪录。与传统框架不同,它优化了低成本、可访问的部署方式,为企业和开发者提供可扩展AI解决方案。
该框架采用模块化设计,核心组件封装完善且可定制,开发者能灵活调整智能体行为。内置丰富工具包,支持网页搜索、文件操作等多种任务。基于Pydantic和Hydra的配置驱动系统,通过YAML文件定义行为,简化开发流程。
Youtu-Agent面向广泛用户群体,提供一键式评估脚本、可移植脚手架和直观视觉跟踪工具,适用于生成研究报告、分析文件等场景,未来还将支持播客和视频生成。
腾讯开源Youtu-Agent,体现了通过协作推动AI发展的决心。它基于openai-agents架构,支持多样化模型API,邀请全球开发者共同参与创新。此次开源也紧随腾讯优图实验室在多模态AI领域的最新进展,进一步巩固了其在AI研究领域的领导地位。
详情查看:Youtu-Agent框架开源,腾讯优图推出模块化AI智能体开发工具
即梦AI与火山引擎合作开放API,支持企业快速接入图像与视频生成模型
近日,即梦AI与火山引擎宣布全面开放API服务,将文生图3.0、文生图3.1、图生图3.0、视频生成3.0pro等多款前沿AI模型向企业级用户开放。
这些模型基于字节跳动自研的Seedream和Seedance等模型持续优化开发,在即梦AI产品上得到大规模验证,具备强大应用能力。开放API服务后,企业开发者无需额外申请,通过自助下单就能快速接入。
目前,这些模型适配多种应用场景。在故事短片创作中,能帮助创作者快速生成精彩画面;营销物料制作时,可生成吸引人的图片和视频;游戏素材设计方面,能提供丰富的创意元素;多媒体课件制作中,让课件更加生动有趣;还能拓展自媒体玩法,增加内容吸引力。
此次全面开放API服务,标志着即梦AI将领先的AI技术能力通过火山引擎平台,更广泛地赋能企业级市场。随着商业应用需求日益增长,即梦AI的这一举措能满足企业高效将创意转化为现实的需求,帮助企业在激烈的市场竞争中脱颖而出,为行业发展注入新的活力。
详情查看:即梦AI与火山引擎合作开放API
通义实验室推出新一代智能体开发框架AgentScope 1.0,让智能体开发更简单安全
通义实验室正式推出新一代智能体开发框架AgentScope 1.0,这是一款以开发者为中心、专注于多智能体开发的开源框架。
AgentScope 1.0采用三层技术架构,包括AgentScope核心框架、AgentScope Runtime和AgentScope Studio,可独立使用满足不同需求。其中,核心框架如同面向智能体开发的“编程语言”,通过模块化设计实现高度解耦与灵活扩展。
在智能体开发关键功能上,它具备实时介入控制、智能上下文管理和高效工具调用三大能力。传统智能体启动后难干预,而AgentScope利用异步架构可实时介入,避免资源浪费。上下文管理方面,通过短期和长期记忆协同,解决信息“失忆”和“混乱”问题,确保对话连贯性。工具管理上,通过标准化注册等提升调用效率,支持运行时动态启用或停用工具。
此外,AgentScope Runtime提供安全工具沙箱,确保智能体执行不影响外部环境;部署运行引擎支持多种协议,方便迁移到云端;AgentScope Studio提供实时监控和评测功能。整体来看,AgentScope 1.0的推出,为智能体开发带来新突破,让开发更简单安全。
AgentScope智能体开发框架地址: https://github.com/agentscope-ai/agentscope (海外网站,需要科学上网)
智谱开发平台推出Claude Code,月套餐费用低至20元
在数字化时代,智谱推出全新Claude Code专属包月套餐,自9月1日起,用户仅需20元超值月费就能享受限时优惠,这为开发者带来了极大便利。
用户通过扫描活动海报二维码或访问智谱开放平台(bigmodel.cn),就能快速购买套餐并获取使用指南。首期套餐聚焦Claude Code,未来还将拓展到更多编程工具。
当前,GLM - 4.5模型已接入多款主流编程工具,如Claude Code、Cline等,全面支持开发者日常开发流程。无论你是编程新手还是经验丰富的开发者,都能在这个平台找到适合自己的工具,提升开发效率。
GLM - 4.5系列模型专为智能体应用设计,采用先进的混合专家(MoE)架构,总参数量3550亿,激活参数320亿,强大架构为用户提供更强大功能支持,助力开发者应对复杂项目。
智谱此次推出新套餐,不仅是技术创新,更是为开发者减轻经济负担的积极探索。对于想提升编程能力的用户来说,这是难得的机会,值得每一位热爱编程的人士关注和参与,开启高效编程新体验。
新模型CoMPaSS-FLUX.1:优化FLUX文本到图像的空间关系表现
近日,研究团队推出的CoMPaSS-FLUX.1模型引起广泛关注。它是一种基于FLUX.1文本到图像扩散模型的LoRA适配器,旨在提升生成图像时对物体空间关系的理解能力。
该模型以FLUX.1 - dev为基础,LoRA等级为16,文件大小约50MB,使用Diffusers框架。其主要用途是生成具有准确空间关系的图像,能创造特定空间排列的构图,同时保持其他能力并增强空间理解。
在性能表现上,CoMPaSS - FLUX.1进步显著。根据VISOR基准测试,相对提升达98%;在T2I - CompBench空间测试中,提升67%;GenEval位置评估中,相对改善达131%。而且,它在图像保真度上也有提升,FID和CMMD分数低于基础模型。
使用时,用户参考有效提示能获得更好效果,模型在描述清晰空间关系时表现最佳。训练过程中,它使用来自SCOP数据引擎的约28000个精心挑选物体对数据,这些数据有严格标准。训练持续24000步,采用批量大小为4的配置,学习率设定为1e - 4,使用AdamW优化器,权重衰减设定为1e - 2。这一模型为图像生成领域带来新可能。(本文由AI辅助生成,部分内容人工编辑)
详情查看:CoMPaSS-FLUX.1模型强势来袭
想了解AITOP100平台其它版块的内容,请点击下方超链接查看
AI创作大赛 | AI活动 | AI工具集 | AI资讯专区
AITOP100平台官方交流社群二维码: