还在羡慕GPT-4o的图像风格化?新加坡国立大学(NUS)给你送福音啦!
最近,NUS团队放大招,发布了一个叫做“OmniConsistency”的牛逼项目。这玩意儿厉害了,能用极低的成本,复制OpenAI的GPT-4o模型在图像风格化上的那种神级一致性。说白了,就是让你的图片既有艺术范儿,又不会失真,更不会像有些AI那样,把人脸都给扭曲了。
大家都知道,现在的图像风格化技术是越来越厉害,但有个老大难问题:想要风格好看,细节就容易丢,语义也容易出问题。为了让风格更炸裂,很多模型直接牺牲了图像的真实性。NUS的科研大佬们盯上了这个痛点,他们想搞出一个能同时兼顾风格和内容一致性的完美方案。
OmniConsistency凭啥这么牛?秘诀在这里!
OmniConsistency最核心的创新,就在于它那套独特的学习框架。跟那些死磕风格化结果的模型不一样,它通过成对的图像数据,学习风格迁移中的一致性规律。更让人惊喜的是,他们只用了2600对高质量图像,然后用GPU跑了500个小时,就搞出了惊艳的效果!这成本,简直不要太良心!
而且,OmniConsistency还采用了模块化设计,支持即插即用,能兼容各种现有的风格化LoRA模块。这意味着,你可以轻松地把OmniConsistency集成到你的项目中,完全不用担心和现有系统打架。
未来可期:开源社区的福音,AI艺术的助推器!
NUS希望通过这项新技术,给开源社区注入商业级的强大能力,让更多的开发者和创作者受益。可以预见,OmniConsistency未来很可能成为图像生成领域的一大利器,推动AI艺术创作更上一层楼!感觉以后人人都能成为AI艺术家啦!
想了解更多?赶紧去GitHub上搜“OmniConsistency”看看吧!
github地址:https://github.com/showlab/OmniConsistency