谷歌Gemma-3开源：多模态大模型，低成本高性能引领AI新纪元-AITOP100,AI资讯

谷歌发布Gemma-3：颠覆性多模态大模型开源

谷歌CEO桑达尔・皮查伊近日宣布，正式开源其多模态大模型Gemma-3。这款备受瞩目的模型以其低成本和高性能特性，有望在人工智能领域掀起一场新的变革。

Gemma-3发布会现场

Gemma-3：参数灵活，算力需求极低

Gemma-3提供了四种参数规模的选择，分别为10亿、40亿、120亿和270亿。最令人印象深刻的是，拥有270亿参数的最大模型仅需一张H100显卡即可进行高效推理。相比之下，同类模型往往需要十倍以上的算力。这使得Gemma-3成为目前对算力要求最低的高性能模型之一，极大地降低了AI应用的门槛。

性能卓越：对话模型评比中名列前茅

在最新的测试数据中，Gemma-3在各类对话模型的评比中表现出色，其性能仅次于DeepSeek模型，超越了OpenAI的o3-mini和Llama3等众多热门模型。Gemma-3的架构延续了前两代的通用解码器Transformer设计，并在其基础上进行了大量的创新和优化。

技术创新：解决长上下文内存难题

为了解决长上下文处理带来的内存问题，Gemma-3采用了局部与全局自注意力层交错的创新架构，有效降低了内存占用。同时，Gemma-3支持的上下文长度扩展到了128K token，为处理篇幅较长的文本提供了强大的支持。

多模态能力：文本与图像的融合

Gemma-3还具备强大的多模态能力，能够同时处理文本和图像信息。它集成了基于VisionTransformer的视觉编码器，有效减少了图像处理的计算成本，为更广泛的应用场景提供了可能性。

训练与优化：海量数据与知识蒸馏

在训练过程中，Gemma-3使用了大量的token预算，尤其是在270亿参数模型中，token量高达14T。此外，模型还引入了多语言数据，显著增强了其语言处理能力，目前支持140种语言，其中35种语言可直接使用。Gemma-3还采用了先进的知识蒸馏技术，在训练后期通过强化学习优化模型表现，尤其是在帮助性、推理能力和多语言能力等方面取得了显著提升。

评测结果：综合实力突出

经过全面的评测，Gemma-3在多模态任务上表现优异，其长文本处理能力也令人印象深刻，准确率高达66%。在对话能力评估中，Gemma-3的表现同样名列前茅，充分展现了其在各项任务中的综合实力。

总结：Gemma-3引领AI新方向

总而言之，Gemma-3的开源将极大地推动人工智能技术的普及和发展。凭借其低成本、高性能、创新的架构和强大的多模态能力，Gemma-3有望成为AI领域的新标杆。

谷歌Gemma-3 AI模型地址：【点击登录】

想了解更多AI创作软件工具请关注AI人工智能网站--AITOP100平台--AI工具集