UniWorld-V2图像编辑模型横空出世，超越Nano Banana！-AITOP100,AI资讯

在2025年的图像编辑江湖里，一场技术风暴正席卷而来！兔展智能携手北京大学UniWorld团队，重磅推出新一代图像编辑模型——UniWorld-V2。这一模型正式上线后，瞬间在行业里炸开了锅，它究竟凭什么能成为中文图像编辑领域的新王呢？

项目地址： https://github.com/PKU-YuanGroup/UniWorld （海外网站需要科学上网）

创新框架：

UniWorld-V2背后，是一个叫UniWorld-R1的创新视觉强化学习框架。这可是个“大杀器”，它首次把强化学习策略优化用在了图像编辑上。传统监督微调方法就像个“死读书”的学生，容易数据过拟合，泛化能力也差。而UniWorld-R1呢，就像个灵活的学霸，能轻松应对各种编辑指令，大大提升了编辑的准确性和灵活性。

和之前那些老方法相比，UniWorld-R1的升级至效果那叫一个明显。它就像给图像编辑装上了“智能导航”，让模型在面对复杂指令时，也能精准找到方向。就好比开车，以前得靠人工看路，现在有了导航，想去哪儿就去哪儿，方便又准确。

细节处理：

在图像处理的细节上，UniWorld-V2的表现堪称惊艳。就拿理解中文指令来说，它就像个精通中文的“图像编辑大师”。当用户要求把一位女生的手势改成“OK”时，它能精准理解并完成修改。反观Nano Banana，就像个“半吊子”，根本没准确捕捉到用户的意图。

更厉害的是，在海报编辑中，UniWorld-V2能轻松渲染出复杂的中文艺术字体，像“月满中秋”这种，字体清晰又语义准确。这就像一个书法大师，不仅能写出漂亮的字，还能把字的意思完美表达出来。

模型性能对比

模型名称	GEdit-Bench得分	ImgEdit得分
UniWorld-V2	7.83	4.49
GPT-Image-1	（数据缺失，但远低于UniWorld-V2）	（数据缺失，但远低于UniWorld-V2）
Gemini2.0	（数据缺失，但远低于UniWorld-V2）	（数据缺失，但远低于UniWorld-V2）

从上面的表格能明显看出，在测试基准GEdit-Bench和ImgEdit中，UniWorld-V2分别以7.83和4.49的高分遥遥领先其他知名模型，像OpenAI的GPT-Image-1和Gemini2.0在它面前，简直弱爆了。

精细化操作：

UniWorld-V2的精细化控制力也让人眼前一亮。用户只需简单框选，就能指定编辑区域，实现高难度的调整。比如把特定物体移出框外，就像变魔术一样轻松。而且，它在光影处理方面也表现出色，能把物体自然地融入场景，让整个画面看起来和谐又美观。

举个例子，当你编辑一张照片，想把画面里的一个多余物体去掉，用UniWorld-V2框选一下，它就能精准识别并完成操作，而且处理后的光影效果自然得就像原本就是这样。

开源共享：

值得一提的是，UniWorld-R1的论文、代码和模型已经在GitHub和Hugging Face平台上公开了。这就像是把一把“万能钥匙”交给了大家，为未来的研究打下了坚实的基础。这一技术的发布，不仅推动了多模态领域的发展，也为图像编辑技术带来了新的可能性。说不定以后，图像编辑会变得更加简单、高效，我们每个人都能成为图像编辑的“高手”。

在AI技术飞速发展的今天，UniWorld-V2的出现无疑是一颗重磅炸弹。它凭借创新的技术、出色的性能和开源共享的精神，在中文图像编辑领域占据了一席之地。相信在未来，它还会带给我们更多的惊喜，让我们一起拭目以待吧！

想了解AITOP100平台其它版块的内容，请点击下方超链接查看

AI 创作大赛 | AI活动 | AI工具集 | AI资讯专区

AITOP100平台官方交流社群二维码：

aitop100官方交流30群