GPT Image 2超越谷歌Nano Banana2:SuperCLUE文生图评测登顶全球榜首,中文准确率获满分
OpenAI旗下最新文生图模型GPT Image 2在SuperCLUE最新评测中正式超越谷歌的Nano Banana2,成功摘得全球文生图模型评测桂冠。该模型自4月21日上线以来,凭借在画质、理解力及细节还原度上的显著迭代刷新了行业技术标准。
本次评测涵盖多个核心维度,GPT Image 2的表现堪称全面。特别是在长期困扰海外模型的汉字生成领域,该模型取得93.07分的高分,文字准确度更是获得满分评级。它不仅能精准识别并生成复杂的汉字,还能实现文字与亚克力、青花瓷等不同材质纹理的深度融合,有效解决了文字"漂浮感"和乱码等长期技术难题。
除文字处理能力的突破外,该模型在复杂场景复刻上也展现了极高的指令遵循度。从极具生活气息的老式面包店到充满动感的非遗打铁花,GPT Image 2均能精准捕捉画面细节。针对长提示词和逻辑推理需求,该模型能够准确产出科学原理图、专业海报等高难度内容,展现出卓越的图文一致性。
评测报告也指出,GPT Image 2在空间关系理解以及深层知识推理方面仍存在一定优化空间,但其在现实复现和创作推理上的优势已足以令其在与谷歌、百度等竞品的角逐中脱颖而出。
业内专家认为,该模型的上线标志着OpenAI在视觉生成领域的再次领先,文生图技术正从简单意象生成走向高精度、重逻辑的专业级应用阶段。
详情查看: https://www.aitop100.cn/infomation/details/33742.html

科大讯飞发布星火X2-Flash:256K长上下文完全基于华为昇腾910B训练,Token消耗降至三分之一
4月29日,科大讯飞正式发布星火X2-Flash模型并同步开放API接口,标志着基于国产算力生态的大模型应用进入全新效能阶段。
该模型采用主流MoE(混合专家)架构,总参数量达30B,最引人注目的是其支持高达256K的超长上下文。星火X2-Flash完全基于华为昇腾910B集群训练完成,展示了国产软硬件在深度学习训练领域的协同能力。在智能体和代码生成能力方面,该模型表现已能比肩业界万亿级参数的顶尖模型。
针对开发者关注的成本问题,星火X2-Flash表现优异。在相同工作流测试中,其Token消耗量仅为目前主流大尺寸模型的三分之一,大幅降低了构建复杂智能体应用的门槛。例如,在创建复杂视频生成技能时,模型不仅能快速理解需求,还能细致提供从技能结构到核心功能的详尽说明。
技术底层方面,星火X2-Flash率先在国产芯片上实现了DSA(稀疏注意力)与MTP(多Token预测)技术的结合,使训练效率相比同规模集群提升4.5倍。此外,针对智能体强化学习场景,该模型将采样推理效率提升了2倍以上,有效缓解了长交互场景下的性能瓶颈。
目前AstronClaw、Loomy等应用已率先完成接入,并实现对OpenClaw、Claude Code等国际主流Agent框架的深度兼容。
工具地址:讯飞星火官网

Anthropic推出Claude for Creative Work:集成Adobe、Blender等主流创意软件,成为专业创意协作伙伴
Anthropic正式发布名为"Claude for Creative Work"的新产品,旨在将其AI模型从传统对话助手扩展到专业创意工作领域。公司明确表示,Claude并不想取代人类创意,而是作为"协作伙伴"帮助创作者加速构思、拓展能力,同时减少重复性任务上的时间浪费。
为实现这一目标,Anthropic推出了一系列与主流创意软件的集成工具。在音乐制作软件Ableton中,Claude可以调取官方文档帮助用户掌握不同功能。在Adobe Creative Cloud中,Claude协助创作和编辑图像、视频等内容。与Canva旗下Affinity合作后,Claude主要用于自动化处理批量编辑和文件整理。在Autodesk Fusion中,Claude支持3D建模,在Blender中则为脚本编写和场景管理提供自然语言接口。
Anthropic与Blender的合作被视为一大亮点——公司作为赞助方加入Blender Development Fund,表明其对开源生态的长期承诺。除产品集成外,Anthropic还加强了在教育领域的投入,携手多所艺术与设计院校推动"创意计算"课程与项目,为学生和教师提供Claude及其连接器的使用权限。
这一系列布局显示,Claude正从通用对话助手向垂直领域的专业工具渗透,AI与创意产业的融合正在进入更深的层次。
工具地址:Claude官网

字节TRAE SOLO上线高级语音输入:联手Insta360推出Mic Air联名麦克风,"动嘴编程"从概念走向日常
字节跳动旗下AI编程平台TRAE在SOLO模式中正式推出内置语音输入功能,并与影石Insta360联合发布Mic Air TRAE联名无线麦克风套装。这一组合让"Vibe Coding"(氛围编程)和语音办公进一步落地,用户可通过自然语音实现结构化转录、语义修正乃至直接语音控制AI命令。
TRAE SOLO语音功能远超普通语音转文字工具。它不仅能将用户口语中的语气词、卡顿等无效内容自动过滤,还能将大段随意表达转化为结构清晰的文字。即使说话时出现错字、漏词、突然补充、中途改口或打乱顺序,AI也能智能理解语义指向,自动归类整理成逻辑连贯的内容。更具突破性的是,用户可通过语音指代具体文件、触发/Plan或/Skills等命令,实现"用嘴下发任务"。
联名Mic Air无线麦克风轻至7.9g,采用48kHz高保真采样率,内置AI降噪功能,续航达10小时,支持磁吸背夹、挂绳等多种佩戴方式。套装限时促销价319元,包含麦克风本体、接收器及TRAE SOLO内测资格。相比手机或电脑内置麦克风,Mic Air在长时间使用、环境适应性和隐私保护上优势明显。
下一阶段,TRAE SOLO将推出实时问答互动功能,用户与AI可像打电话般"边说边讨论",无需等待整段处理完成。
随着AI编码与办公工具的成熟,"用嘴办公"正从概念走向日常,TRAE与Insta360的合作不仅解决了音频输入质量这一关键痛点,也为硬件厂商切入AI生产力场景提供了新范例。
工具地址:字节TRAE官网

Adobe Photoshop引入AI旋转对象功能:2D素材秒变3D视角,智能光影自动匹配背景
Adobe发布Photoshop与Lightroom重大版本更新,正式将生成式AI技术延伸至3D空间处理领域。本次最受关注的突破是引入"旋转对象"工具,打破了传统平面素材在空间编辑上的局限。
通过这一全新功能,用户可以在3D空间内实时旋转、倾斜或翻转2D素材。该技术不仅能改变物体透视角度,还能根据环境自动调整画面视觉逻辑,极大提升了合成创作的自由度。为解决素材旋转后与背景融合不自然的问题,Photoshop同步推出"协调"功能——用户只需一键点击,AI便会自动计算环境光照方向,重构物体的光影细节,确保素材与背景完美匹配。
除视觉编辑的进化外,新版软件针对专业工作流进行了深度优化。"图层清理"工具现已正式落地,能智能重命名图层并自动剔除冗余项,帮助创作者从繁琐的项目组织中解脱出来。云端编辑器Lightroom的搜索系统现在支持更精准的自然语言查询,用户可直接输入描述性词汇来寻找特定照片,传统标签式检索体验因此将发生质变。
在底层性能方面,新版软件的交互滑块响应速度提升最高5倍。配合新增的多款复古胶片预设,摄影师在处理海量素材时将获得更流畅、更具掌控力的后期编辑体验。
Adobe通过这轮更新持续巩固其在图像编辑领域的技术护城河,而生成式AI向3D空间的延伸,预示着创意工具的下一个竞争焦点正在转向空间智能。

腾讯ima上线知识Agent copilot:内置"Soul-User-Memory-Agent"四大记忆模块,全端覆盖支持多设备联动
4月29日,腾讯旗下智能工作台ima正式推出个人知识Agent——copilot。该产品旨在通过深度个性化记忆与全场景感知能力,将原有AI搜索工具升级为具备持续进化能力的个人知识伙伴,标志着AI应用从单次对话工具向长效智能体的关键转型。
技术层面,copilot核心集成了由"Soul(人设)、User(用户档案)、Memory(长期记忆)、Agent(经验技巧)"四大模块组成的自主进化记忆系统,能够跨场景结构化存储用户背景与偏好,消除重复输入的交互冗余。这意味着copilot不仅能回答问题,还能记住用户的工作风格、专业背景和长期关注领域,从而提供越来越精准的个性化服务。
在应用层面,copilot实现了全场景感知,可作为浮窗悬停于应用内,直接基于当前浏览的网页、文件或笔记进行实时理解与处理。此外,同步上线的Skills生态不仅内置了跨文件汇总、知识库自动化整理等官方技能,还支持用户通过Skillhub或API自行接入主流大模型,构建定制化技能链路。
目前copilot已全面覆盖Mac、Windows、iOS、安卓及鸿蒙平台,并采取申请制分批开放。在AI助手赛道竞争加剧的背景下,ima通过强化底层记忆资产与技能扩展性,正试图定义"下一代知识管理"的形态。这种从单纯的信息索引向深度上下文感知的迭代,将显著提升知识工作者在复杂任务中的交付效率与数字资产沉淀能力。
工具地址:腾讯ima

WorkBuddy深度集成腾讯文档:业内首个与主流文档产品打通的AI办公智能体,"取-用-存"闭环落地
WorkBuddy今日正式上线"资料库"功能,并率先与腾讯文档实现深度集成,成为业内首个与主流文档及知识库产品深度打通的AI办公智能体。
用户现可在WorkBuddy中直接调用、编辑和保存腾讯文档中的文件,全程无需下载、上传或切换应用,实现"知识生产-管理"闭环。该功能支持从"资料库"选中文档、向WorkBuddy下达修改指令、并直接保存回腾讯文档三步操作。同时,手机端WorkBuddy小程序也同步支持此功能,满足移动办公需求。
此次升级旨在打通个人知识管理的"最后一公里"。传统工作流中,用户往往需要在多个应用间反复切换——先在文档工具中编写,再复制到AI助手处理,最后再粘贴回原应用——整个过程充满摩擦。WorkBuddy通过与腾讯文档的底层打通,将AI处理能力直接嵌入文档工作流的核心环节,用户可以在不离开文档生态的情况下完成信息整理、内容优化和知识管理等一系列操作。
WorkBuddy与腾讯文档的联动,标志着AI智能体在办公场景的集成应用进入新阶段。随着更多主流办公工具向AI智能体开放深度集成权限,AI正从"外接工具"转变为"内嵌能力",办公场景的智能化正迎来实质性突破。
工具地址:WorkBuddy官网

AITOP100-AI资讯频道将持续关注AI行业新闻资讯消息,带来最新AI内容讯息。
想了解AITOP100平台其它版块的内容,请点击下方超链接查看
AI创作大赛 | AI活动 | AI工具集 | AI资讯专区 | AI小说
AITOP100平台官方交流社群二维码:










