每日AI资讯-2025年09月02日-AITOP100,AI资讯

腾讯混元翻译模型Hunyuan-MT-7B重磅开源，国际赛事斩获30项冠军

近日，腾讯宣布其混元翻译模型Hunyuan-MT-7B正式开源。这一轻量级模型参数量仅7亿，却具备强大翻译能力，支持33种语言及5种民汉语言和方言互译。

在国际计算语言学协会（ACL）WMT2025比赛中，Hunyuan-MT-7B表现惊艳，在31种语言赛事里拿下30个第一名，涵盖常见语种及捷克语、马拉地语等小语种。即便模型参数规模受限，它仍超越诸多参数更大的模型，这得益于其能更好理解对话背景与上下文，可精准翻译俚语、古诗、社交对话缩写等复杂文本。

除了Hunyuan-MT-7B，腾讯还推出Hunyuan-MT-Chimera-7B翻译集成模型，能根据多种译文生成更优质结果，支持接入其他模型，适合专业翻译场景。

Hunyuan-MT-7B优势不仅在翻译效果，计算效率和部署友好性也出色。它推理速度更快，在相同硬件下可处理更多翻译请求，且基于腾讯自研的AngelSlim大模型压缩工具，推理性能提升30%。目前，该模型已在腾讯会议、企业微信、QQ浏览器等业务中应用，提升用户体验。腾讯自2023年推出混元就积极开源，未来还将开放更多模型和技术，携手共建开放大模型生态。

详情查看：腾讯混元翻译模型Hunyuan-MT-7B开源

腾讯混元翻译模型Hunyuan-MT-7B

腾讯开源混元世界模型Voyager，实现单图生成3D世界，登顶WorldScore排行榜

腾讯AI研究团队Hunyuan又有大动作，其开源的HunyuanWorld-Voyager引发全球AI与3D技术领域热议。作为具备原生3D重建能力的超长程世界模型，它在WorldScore排行榜上登顶，超越Gen-3等竞品。

该模型最大亮点是原生3D重建，一张图像就能生成与世界一致的3D点云，省去传统复杂前处理步骤，能高效捕捉图像几何和语义细节，在游戏开发、VR、数字内容创作等领域潜力巨大。

在相机控制方面，它表现出色。用户可自定义相机路径，模型能生成几何一致的3D场景，保持空间连贯性，还支持实时生成精确对齐的深度信息和RGB视频，提升开发效率。

HunyuanWorld-Voyager应用场景广泛，游戏开发中可快速生成可交互3D世界，缩短开发周期；VR领域能提供逼真虚拟体验；在机器人导航、自动驾驶和AR等前沿领域也有出色表现。

此次开源是腾讯2025年开源计划重要一环，此前已开源多款3D生成模型。HunyuanWorld-Voyager的发布巩固了腾讯在全球AI竞赛中的领先地位，其开放模式也对抗了西方封闭生态垄断，推动3D内容创作民主化。

详情查看：腾讯开源混元世界模型Voyager

腾讯优图开源Youtu-Agent，为AI智能体开发添新动力

2025年9月2日，腾讯优图实验室宣布开源Youtu-Agent框架，这是一款专为构建、运行和评估自主AI智能体设计的模块化框架，面向全球开发者开放。

Youtu-Agent在多项挑战性基准测试中表现卓越，采用DeepSeek-V3等开源模型，在WebWalkerQA测试准确率达71.47%，在GAIA文本验证子集达72.8%，创开源智能体框架新纪录。与传统框架不同，它优化了低成本、可访问的部署方式，为企业和开发者提供可扩展AI解决方案。

该框架采用模块化设计，核心组件封装完善且可定制，开发者能灵活调整智能体行为。内置丰富工具包，支持网页搜索、文件操作等多种任务。基于Pydantic和Hydra的配置驱动系统，通过YAML文件定义行为，简化开发流程。

Youtu-Agent面向广泛用户群体，提供一键式评估脚本、可移植脚手架和直观视觉跟踪工具，适用于生成研究报告、分析文件等场景，未来还将支持播客和视频生成。

腾讯开源Youtu-Agent，体现了通过协作推动AI发展的决心。它基于openai-agents架构，支持多样化模型API，邀请全球开发者共同参与创新。此次开源也紧随腾讯优图实验室在多模态AI领域的最新进展，进一步巩固了其在AI研究领域的领导地位。

详情查看：Youtu-Agent框架开源，腾讯优图推出模块化AI智能体开发工具

Youtu-Agent

即梦AI与火山引擎合作开放API，支持企业快速接入图像与视频生成模型

近日，即梦AI与火山引擎宣布全面开放API服务，将文生图3.0、文生图3.1、图生图3.0、视频生成3.0pro等多款前沿AI模型向企业级用户开放。

这些模型基于字节跳动自研的Seedream和Seedance等模型持续优化开发，在即梦AI产品上得到大规模验证，具备强大应用能力。开放API服务后，企业开发者无需额外申请，通过自助下单就能快速接入。

目前，这些模型适配多种应用场景。在故事短片创作中，能帮助创作者快速生成精彩画面；营销物料制作时，可生成吸引人的图片和视频；游戏素材设计方面，能提供丰富的创意元素；多媒体课件制作中，让课件更加生动有趣；还能拓展自媒体玩法，增加内容吸引力。

此次全面开放API服务，标志着即梦AI将领先的AI技术能力通过火山引擎平台，更广泛地赋能企业级市场。随着商业应用需求日益增长，即梦AI的这一举措能满足企业高效将创意转化为现实的需求，帮助企业在激烈的市场竞争中脱颖而出，为行业发展注入新的活力。

详情查看：即梦AI与火山引擎合作开放API

即梦AI与火山引擎合作开放API

通义实验室推出新一代智能体开发框架AgentScope 1.0，让智能体开发更简单安全

通义实验室正式推出新一代智能体开发框架AgentScope 1.0，这是一款以开发者为中心、专注于多智能体开发的开源框架。

AgentScope 1.0采用三层技术架构，包括AgentScope核心框架、AgentScope Runtime和AgentScope Studio，可独立使用满足不同需求。其中，核心框架如同面向智能体开发的“编程语言”，通过模块化设计实现高度解耦与灵活扩展。

在智能体开发关键功能上，它具备实时介入控制、智能上下文管理和高效工具调用三大能力。传统智能体启动后难干预，而AgentScope利用异步架构可实时介入，避免资源浪费。上下文管理方面，通过短期和长期记忆协同，解决信息“失忆”和“混乱”问题，确保对话连贯性。工具管理上，通过标准化注册等提升调用效率，支持运行时动态启用或停用工具。

此外，AgentScope Runtime提供安全工具沙箱，确保智能体执行不影响外部环境；部署运行引擎支持多种协议，方便迁移到云端；AgentScope Studio提供实时监控和评测功能。整体来看，AgentScope 1.0的推出，为智能体开发带来新突破，让开发更简单安全。

AgentScope智能体开发框架地址： https://github.com/agentscope-ai/agentscope （海外网站，需要科学上网）

智能体开发框架AgentScope 1.0

智谱开发平台推出Claude Code，月套餐费用低至20元

在数字化时代，智谱推出全新Claude Code专属包月套餐，自9月1日起，用户仅需20元超值月费就能享受限时优惠，这为开发者带来了极大便利。

用户通过扫描活动海报二维码或访问智谱开放平台（bigmodel.cn），就能快速购买套餐并获取使用指南。首期套餐聚焦Claude Code，未来还将拓展到更多编程工具。

当前，GLM - 4.5模型已接入多款主流编程工具，如Claude Code、Cline等，全面支持开发者日常开发流程。无论你是编程新手还是经验丰富的开发者，都能在这个平台找到适合自己的工具，提升开发效率。

GLM - 4.5系列模型专为智能体应用设计，采用先进的混合专家（MoE）架构，总参数量3550亿，激活参数320亿，强大架构为用户提供更强大功能支持，助力开发者应对复杂项目。

智谱此次推出新套餐，不仅是技术创新，更是为开发者减轻经济负担的积极探索。对于想提升编程能力的用户来说，这是难得的机会，值得每一位热爱编程的人士关注和参与，开启高效编程新体验。

详情查看：智谱推出20元Claude Code月套餐

智谱开发平台推出Claude Code

新模型CoMPaSS-FLUX.1：优化FLUX文本到图像的空间关系表现

近日，研究团队推出的CoMPaSS-FLUX.1模型引起广泛关注。它是一种基于FLUX.1文本到图像扩散模型的LoRA适配器，旨在提升生成图像时对物体空间关系的理解能力。

该模型以FLUX.1 - dev为基础，LoRA等级为16，文件大小约50MB，使用Diffusers框架。其主要用途是生成具有准确空间关系的图像，能创造特定空间排列的构图，同时保持其他能力并增强空间理解。

在性能表现上，CoMPaSS - FLUX.1进步显著。根据VISOR基准测试，相对提升达98%；在T2I - CompBench空间测试中，提升67%；GenEval位置评估中，相对改善达131%。而且，它在图像保真度上也有提升，FID和CMMD分数低于基础模型。

使用时，用户参考有效提示能获得更好效果，模型在描述清晰空间关系时表现最佳。训练过程中，它使用来自SCOP数据引擎的约28000个精心挑选物体对数据，这些数据有严格标准。训练持续24000步，采用批量大小为4的配置，学习率设定为1e - 4，使用AdamW优化器，权重衰减设定为1e - 2。这一模型为图像生成领域带来新可能。（本文由AI辅助生成，部分内容人工编辑）

详情查看：CoMPaSS-FLUX.1模型强势来袭

新模型CoMPaSS-FLUX.1