• 首页
  • AI工具集
  • AI资讯
  • AI活动
  • AI社区
  • AI短剧
  • AI创作大赛
  • AI小说
  • AI绘画
    AI视频
    AI对口型
    AI创意二维码
    AI艺术字
    AI智能抠图
  • AI漫剧创作热门-AI社区
AI 对话

字节跳动刚刚发布了 UNO!

字节跳动刚刚发布了 UNO!
AI TOP100
2025-04-09 17:42:48

UNO是什么?

uno

UNO 是一个由字节跳动(ByteDance)研究团队开发的多主体条件图像生成模型。它通过扩散变换器的上下文生成能力,生成高一致性的多主体配对数据。

UNO 的核心特点是:

  • 多图像条件生成:支持单主体和多主体驱动的图像生成。
  • 渐进式跨模态对齐:通过逐步对齐不同模态(如文本和图像)来提高生成一致性。
  • 通用旋转位置嵌入:支持多种分辨率和长宽比的图像生成。


UNO快速入门

环境配置

  1. 创建虚拟环境并安装依赖:
python -m venv uno_env
source uno_env/bin/activate
pip install -r requirements.txt

2.下载模型权重:自动下载:运行推理脚本时,代码会自动下载权重。手动下载:使用 huggingface-cli 下载权重到指定目录。

推理示例

运行以下命令生成图像:

python inference.py --prompt "A clock on the beach is under a red sun umbrella" --image_paths "assets/clock.png" --width 704 --height 704

训练

运行训练脚本:

accelerate launch train.py

应用场景

UNO 可以用于以下场景:

  • 单主体生成:根据一张参考图像生成图像。
  • 多主体生成:根据多张参考图像生成图像。
  • 上下文生成:通过上下文提示生成高一致性的图像。

应用限制

  • UNO 在单主体和多主体生成中表现出色,但在泛化能力上仍有提升空间。
  • 模型训练数据集的限制可能导致某些场景的生成效果不佳。

开源计划

项目已开源,包括:

  • 推理代码
  • 训练代码
  • 模型权重
  • arXiv 论文
  • Hugging Face 空间演示
  • 上下文数据生成管道

引用

如果您使用 UNO,请引用以下论文:

@article{wu2025less,
  title={Less-to-More Generalization: Unlocking More Controllability by In-Context Generation},
  author={Wu, Shaojin and Huang, Mengqi and Wu, Wenxu and Cheng, Yufeng and Ding, Fei and He, Qian},
  journal={arXiv preprint arXiv:2504.02160},
  year={2025}
}

项目页面:https://bytedance.github.io/UNO

代码:https://github.com/bytedance/UNO

0
0
文章来源:AI TOP100
免责声明:本文不代表本平台立场,且不构成投资建议,请谨慎对待。
全部评论
暂无评论
相关资讯
  • 爱诗科技携手阿里云,获得全栈AI支持以推进PixVerse全球服务

  • 腾讯发布混元世界模型1.5,支持实时交互与多模态生成

  • 字节跳动发布Seedance 1.5 Pro模型,支持音视频联合生成

  • 豆包手机助手上线,nubia M153工程机首批售罄,官方称备货不足暂停F码申请

  • 阿里震撼发布万相2.6模型,首次支持角色扮演与专业分镜控制

热点资讯

2025秘塔AI工具爆发式更新:API降价70%+千万月活,AI搜索市场格局生变

8天前
2025秘塔AI工具爆发式更新:API降价70%+千万月活,AI搜索市场格局生变

灵光AI助手推出网页版:电脑端可快速生成“闪应用”,数据与手机同步

8天前
灵光AI助手推出网页版:电脑端可快速生成“闪应用”,数据与手机同步

迎马年贺五福·支付宝红包封面大赛

6天前
迎马年贺五福·支付宝红包封面大赛

每日AI资讯-2025年12月09日

8天前
每日AI资讯-2025年12月09日

重磅消息!GLM-ASR系列模型开源,智谱AI输入法惊艳登场

7天前
重磅消息!GLM-ASR系列模型开源,智谱AI输入法惊艳登场
分享
0
0

欢迎来到AI Top100!我们聚合全球500+款AI智能软件,提供最新资讯、热门课程和活动。我们致力于打造最专业的信息平台,让您轻松了解全球AI领域动态,并为您提供优质服务。

合作伙伴
联系我们
加入AITOP100社群
加入社群
AITOP100商务微信
商务微信
相关链接
服务及隐私政策
网站地图
关于我们
粤ICP备2022124843号-2粤公网安备44030002004505广播电视节目制作经营许可证:(粤)字第00712号Copyright © 华强方特(深圳)动漫有限公司 版权所有