在2025年的图像编辑江湖里,一场技术风暴正席卷而来!兔展智能携手北京大学UniWorld团队,重磅推出新一代图像编辑模型——UniWorld-V2。这一模型正式上线后,瞬间在行业里炸开了锅,它究竟凭什么能成为中文图像编辑领域的新王呢?
项目地址: https://github.com/PKU-YuanGroup/UniWorld (海外网站需要科学上网)
创新框架:
UniWorld-V2背后,是一个叫UniWorld-R1的创新视觉强化学习框架。这可是个“大杀器”,它首次把强化学习策略优化用在了图像编辑上。传统监督微调方法就像个“死读书”的学生,容易数据过拟合,泛化能力也差。而UniWorld-R1呢,就像个灵活的学霸,能轻松应对各种编辑指令,大大提升了编辑的准确性和灵活性。
和之前那些老方法相比,UniWorld-R1的升级至效果那叫一个明显。它就像给图像编辑装上了“智能导航”,让模型在面对复杂指令时,也能精准找到方向。就好比开车,以前得靠人工看路,现在有了导航,想去哪儿就去哪儿,方便又准确。

细节处理:
在图像处理的细节上,UniWorld-V2的表现堪称惊艳。就拿理解中文指令来说,它就像个精通中文的“图像编辑大师”。当用户要求把一位女生的手势改成“OK”时,它能精准理解并完成修改。反观Nano Banana,就像个“半吊子”,根本没准确捕捉到用户的意图。
更厉害的是,在海报编辑中,UniWorld-V2能轻松渲染出复杂的中文艺术字体,像“月满中秋”这种,字体清晰又语义准确。这就像一个书法大师,不仅能写出漂亮的字,还能把字的意思完美表达出来。

模型性能对比
| 模型名称 | GEdit-Bench得分 | ImgEdit得分 |
|---|---|---|
| UniWorld-V2 | 7.83 | 4.49 |
| GPT-Image-1 | (数据缺失,但远低于UniWorld-V2) | (数据缺失,但远低于UniWorld-V2) |
| Gemini2.0 | (数据缺失,但远低于UniWorld-V2) | (数据缺失,但远低于UniWorld-V2) |
从上面的表格能明显看出,在测试基准GEdit-Bench和ImgEdit中,UniWorld-V2分别以7.83和4.49的高分遥遥领先其他知名模型,像OpenAI的GPT-Image-1和Gemini2.0在它面前,简直弱爆了。
精细化操作:
UniWorld-V2的精细化控制力也让人眼前一亮。用户只需简单框选,就能指定编辑区域,实现高难度的调整。比如把特定物体移出框外,就像变魔术一样轻松。而且,它在光影处理方面也表现出色,能把物体自然地融入场景,让整个画面看起来和谐又美观。
举个例子,当你编辑一张照片,想把画面里的一个多余物体去掉,用UniWorld-V2框选一下,它就能精准识别并完成操作,而且处理后的光影效果自然得就像原本就是这样。
开源共享:
值得一提的是,UniWorld-R1的论文、代码和模型已经在GitHub和Hugging Face平台上公开了。这就像是把一把“万能钥匙”交给了大家,为未来的研究打下了坚实的基础。这一技术的发布,不仅推动了多模态领域的发展,也为图像编辑技术带来了新的可能性。说不定以后,图像编辑会变得更加简单、高效,我们每个人都能成为图像编辑的“高手”。
在AI技术飞速发展的今天,UniWorld-V2的出现无疑是一颗重磅炸弹。它凭借创新的技术、出色的性能和开源共享的精神,在中文图像编辑领域占据了一席之地。相信在未来,它还会带给我们更多的惊喜,让我们一起拭目以待吧!
想了解AITOP100平台其它版块的内容,请点击下方超链接查看
AI创作大赛 | AI活动 | AI工具集 | AI资讯专区
AITOP100平台官方交流社群二维码:









