• 首页
  • AI工具集
  • AI资讯
  • AI活动
  • AI社区
  • AI短剧
  • AI创作大赛
  • AI小说
  • AI绘画
    AI视频
    AI对口型
    AI创意二维码
    AI艺术字
    AI智能抠图
  • AI漫剧创作热门-AI社区
AI 对话

CogView4:智谱AI开源中文文生图模型,图像生成新突破

CogView4:智谱AI开源中文文生图模型,图像生成新突破
AI TOP100
2025-03-05 09:45:08

智谱AI发布CogView4:首个开源中文文生图模型

智谱AI发布了最新的开源文生图模型CogView4。该模型参数量达到6亿,全面支持中文输入与中文文本到图像生成,并被称为“首个能在画面中生成汉字的开源模型”。

智谱AI发布CogView4

CogView4的核心优势在于支持中英双语提示词输入,尤其擅长理解和执行复杂的中文指令,极大地便利了中文内容创作者。作为首个能在图像中生成汉字的开源文生图模型,它填补了开源领域在该方向上的空白。此外,该模型支持生成任意宽高比的图片,并且能够处理任意长度的提示词输入,展现了高度的灵活性。

CogView4的双语能力得益于技术架构的全面升级。其文本编码器升级为GLM-4,能够同时处理中英双语输入,打破了以往开源模型仅支持英文的限制。据悉,为了保证模型在中文语境下的生成质量,CogView4使用了中英双语图文对进行训练。

在文本处理方面,CogView4采用了动态文本长度方案,取代了传统的固定长度设计。当平均描述文本长度为200-300个词元时,与固定512词元的传统方案相比,冗余减少约50%,训练效率提升5%-30%。这一创新不仅优化了计算资源的使用,还使模型能更高效地处理不同长度的提示词。

CogView4的技术亮点

CogView4支持生成任意分辨率的图像,这背后是多项技术突破。该模型采用混合分辨率训练,结合二维旋转位置编码和内插位置表示,以适应不同的尺寸需求。此外,它还基于Flow-matching扩散模型和参数化线性动态噪声规划,进一步提高了生成图像的质量和多样性。

CogView4的技术亮点

CogView4的训练流程分为多个阶段:从基础分辨率训练开始,到泛分辨率适配,再到高质量数据微调,最后通过人类偏好对齐优化输出。该过程保留了Share-param DiT架构,同时为不同模态引入独立的自适应层归一化,确保模型在多种任务中的稳定性和一致性。

智谱AI开源中文文生图模型-CogView4地址:【点击登录】

想了解更多AI创作软件工具请关注AI人工智能网站--AITOP100平台--AI工具集

0
0
免责声明:本文不代表本平台立场,且不构成投资建议,请谨慎对待。
全部评论
暂无评论
相关AI工具
  • 智谱清言
相关资讯
  • 支付宝AI付春节用户破1亿,一句话解锁AI支付新体验

  • 编程党狂喜!阿里千问Qwen Coding Plan上线 双新模型适配拉满

  • 魔法原子成总台《2026春晚》智能机器人战略合作伙伴,“具身智能”走到聚光灯下

  • 豆包联动总台春晚上线“开好运锦囊”:超10万份科技好礼、最高8888元现金红包

  • 卷疯编程赛道!MiniMax M2.5上线 可直接调用对标顶尖

热点资讯

谷歌三连炸!Lyria3+Google Music上线,Gemini3.1更新

4天前
谷歌三连炸!Lyria3+Google Music上线,Gemini3.1更新

编程党狂喜!阿里千问Qwen Coding Plan上线 双新模型适配拉满

4天前
编程党狂喜!阿里千问Qwen Coding Plan上线 双新模型适配拉满

卷疯AI模特圈!Runway集结全球顶尖阵容 覆盖全场景创作

3天前
卷疯AI模特圈!Runway集结全球顶尖阵容 覆盖全场景创作

支付宝AI付春节用户破1亿,一句话解锁AI支付新体验

2天前
支付宝AI付春节用户破1亿,一句话解锁AI支付新体验
分享
0
0

欢迎来到AI Top100!我们聚合全球500+款AI智能软件,提供最新资讯、热门课程和活动。我们致力于打造最专业的信息平台,让您轻松了解全球AI领域动态,并为您提供优质服务。

合作伙伴
联系我们
加入AITOP100社群
加入社群
AITOP100商务微信
商务微信
相关链接
服务及隐私政策
网站地图
关于我们
粤ICP备2022124843号-2粤公网安备44030002004505广播电视节目制作经营许可证:(粤)字第00712号Copyright © 华强方特(深圳)动漫有限公司 版权所有