DeepSeek发布Janus-Pro-7B文生图大模型，进军文生图领域-AITOP100,AI资讯

北京时间2025年1月28日凌晨，国产大模型公司DeepSeek正式发布了名为Janus-Pro的多模态大模型，其中备受瞩目的70亿参数版本Janus-Pro-7B也随之亮相。作为一家背后有量化巨头幻方量化支持的公司，DeepSeek此次发布的Janus-Pro-7B无疑为AI领域带来了新一轮的创新与突破。

DeepSeek发布Janus-Pro-7B文生图大模型

Janus-Pro-7B作为一个统一的多模态大语言模型（MLLM），其核心特点在于将视觉编码过程从多模态理解和生成中解耦，实现了更高效的处理。这一创新设计不仅提升了模型的灵活性，还有效缓解了视觉编码器在理解和生成过程中可能出现的冲突。同时，Janus-Pro-7B还采用了一种新颖的自回归框架，通过拆分视觉编码过程为多个独立路径，进一步优化了模型的处理效率。

在训练策略和数据方面，Janus-Pro-7B相比前代模型进行了全面优化。扩展的训练数据、更大的模型规模以及改进的训练策略，使得Janus-Pro-7B在多模态理解和文本到图像的指令跟踪功能方面取得了显著进展。特别是在文本到图像生成方面，Janus-Pro-7B的稳定性得到了极大提升，生成的图像既具有视觉吸引力又保持稳定。

DeepSeek发布Janus-Pro-7B文生图大模型

在性能表现上，Janus-Pro-7B更是展现出了卓越的实力。在GenEval和DPG-Bench基准测试中，它不仅击败了OpenAI的DALL-E 3等热门模型，还以80%和84.2%的准确率测试结果，彰显了其在多模态理解和生成方面的领先地位。尽管目前Janus-Pro-7B只能处理384x384分辨率的图像，但其紧凑的模型尺寸和出色的性能已经令人惊艳不已。

DeepSeek发布Janus-Pro-7B文生图大模型