巅峰对决！谷歌Gemini嵌入模型击败OpenAI，问鼎MTEB全球第一-AITOP100,AI资讯

2025年7月15日凌晨1点，谷歌悄悄放了个大招——首个Gemini嵌入模型正式发布，直接在多文本嵌入基准测试平台（MTEB）上以68.37分登顶，把OpenAI的58.93分远远甩在身后。这一成绩不仅让谷歌在嵌入技术领域稳坐头把交椅，更给独立创作者和自由职业者送来了一份“经济实惠”的大礼：每100万token仅需0.15美元，成本直接拉低，性价比拉满！

谷歌Gemini嵌入模型

Gemini嵌入模型是什么？

Gemini嵌入模型是谷歌推出的创新性文本嵌入模型。它基于Gemini模型训练，能将文本转化为高维度数值向量以捕捉语义和上下文信息。该模型支持超过100种语言，输入标记长度可达8K，输出为3K维向量，并可通过MRL技术灵活调整维度以优化存储成本。它适用于信息检索、文本分类等多种场景，已集成至Gemini API，且在多文本嵌入基准测试平台（MTEB）上表现优异，以高分登顶，展现出强大的文本处理能力。

Gemini嵌入模型官网地址

体验地址：Google AI Studio：谷歌在线平台（该模型在谷歌在线平台上体验）

Gemini嵌入模型：为啥这么强？

1. 多任务全能选手，双语能力更亮眼

Gemini嵌入模型可不是“偏科生”。根据测试结果，它在双语挖掘、分类、聚类、指令检索、多标签分类、配对分类、重排、检索和语义文本相似性等任务中表现堪称“全能王”。尤其是它的多语言能力，让它在全球范围内的应用潜力大增——毕竟，英语母语者只是全球用户的一部分，非英语用户的需求同样不容忽视。

2. 架构创新：双向Transformer+池化层，简单有效

Gemini嵌入模型基于双向Transformer编码器架构设计，保留了Gemini模型的双向注意力机制，这让它在语言理解上更上一层楼。更值得一提的是，模型在底层32层Transformer的基础上，加了一个池化层，通过均值池化策略将输入序列的每个token嵌入聚合，生成单一的嵌入向量。这种设计简单却高效，大大增强了模型的适应性。

谷歌Gemini嵌入模型