• 首页
  • AI工具集
  • AI资讯
  • AI活动
  • AI社区
  • AI短剧
  • AI创作大赛
  • AI小说
  • AI绘画
    AI视频
    AI对口型
  • AI漫剧创作
AI 对话

CogView4:智谱AI开源中文文生图模型,图像生成新突破

CogView4:智谱AI开源中文文生图模型,图像生成新突破
AI TOP100
2025-03-05 09:45:08

智谱AI发布CogView4:首个开源中文文生图模型

智谱AI发布了最新的开源文生图模型CogView4。该模型参数量达到6亿,全面支持中文输入与中文文本到图像生成,并被称为“首个能在画面中生成汉字的开源模型”。

智谱AI发布CogView4

CogView4的核心优势在于支持中英双语提示词输入,尤其擅长理解和执行复杂的中文指令,极大地便利了中文内容创作者。作为首个能在图像中生成汉字的开源文生图模型,它填补了开源领域在该方向上的空白。此外,该模型支持生成任意宽高比的图片,并且能够处理任意长度的提示词输入,展现了高度的灵活性。

CogView4的双语能力得益于技术架构的全面升级。其文本编码器升级为GLM-4,能够同时处理中英双语输入,打破了以往开源模型仅支持英文的限制。据悉,为了保证模型在中文语境下的生成质量,CogView4使用了中英双语图文对进行训练。

在文本处理方面,CogView4采用了动态文本长度方案,取代了传统的固定长度设计。当平均描述文本长度为200-300个词元时,与固定512词元的传统方案相比,冗余减少约50%,训练效率提升5%-30%。这一创新不仅优化了计算资源的使用,还使模型能更高效地处理不同长度的提示词。

CogView4的技术亮点

CogView4支持生成任意分辨率的图像,这背后是多项技术突破。该模型采用混合分辨率训练,结合二维旋转位置编码和内插位置表示,以适应不同的尺寸需求。此外,它还基于Flow-matching扩散模型和参数化线性动态噪声规划,进一步提高了生成图像的质量和多样性。

CogView4的技术亮点

CogView4的训练流程分为多个阶段:从基础分辨率训练开始,到泛分辨率适配,再到高质量数据微调,最后通过人类偏好对齐优化输出。该过程保留了Share-param DiT架构,同时为不同模态引入独立的自适应层归一化,确保模型在多种任务中的稳定性和一致性。

智谱AI开源中文文生图模型-CogView4地址:【点击登录】

想了解更多AI创作软件工具请关注AI人工智能网站--AITOP100平台--AI工具集

0
0
免责声明:本文不代表本平台立场,且不构成投资建议,请谨慎对待。
全部评论
暂无评论
相关AI工具
  • 智谱清言
相关资讯
  • 方特帧美剧场首部剧集《我在末世卖炒粉,凶兽全到锅里来》先导预告重磅发布

  • MateClaw v1.5.0 更新:AI 智能体正在从“会执行”走向“可工程化”

  • 快看漫画发布Livo数字生命产品,漫画IP开启AI自运转新时代

  • 微信开放AI生态接入能力,小程序迎来AI调用新机遇

  • 顾全全离职字节跳动Seed,AI for Science赛道迎来创业新变局

热点资讯

🔥横店国际AI短剧生态展映征集:让你的AI作品登陆横店影视产业核心舞台

7天前
🔥横店国际AI短剧生态展映征集:让你的AI作品登陆横店影视产业核心舞台

每日AI资讯-2026年6月01日

9天前
每日AI资讯-2026年6月01日

yoroll×小云雀AI|《丧尸清道夫》宇宙AI短片挑战赛

1天前
yoroll×小云雀AI|《丧尸清道夫》宇宙AI短片挑战赛

小云雀启动短剧出海逐浪计划,多重激励赋能出海机构

1天前
小云雀启动短剧出海逐浪计划,多重激励赋能出海机构

「冠军之选 纪录传奇」AIGC视频创作大赛

1天前
「冠军之选 纪录传奇」AIGC视频创作大赛
分享
0
0

欢迎来到AI Top100!我们聚合全球500+款AI智能软件,提供最新资讯、热门课程和活动。我们致力于打造最专业的信息平台,让您轻松了解全球AI领域动态,并为您提供优质服务。

合作伙伴
联系我们
加入AITOP100社群
加入社群
AITOP100商务微信
商务微信
相关链接
服务及隐私政策
网站地图
关于我们
粤ICP备2022124843号-2粤公网安备44030002004505广播电视节目制作经营许可证:(粤)字第00712号Copyright © 华强方特(深圳)动漫有限公司 版权所有