Gemini API 大升级：谷歌推出“隐式缓存”省钱大法！

Gemini API 大升级：谷歌推出“隐式缓存”省钱大法！

2025-05-09 10:16:42

Gemini API 放大招：隐式缓存，省钱就是硬道理！

最近啊，谷歌给Gemini API 搞了个大动作，推出了一个叫做“隐式缓存”的黑科技。啥意思呢？简单来说，就是帮你省钱！用 AI 模型，尤其是Gemini这类高端货，那费用可不低。这新功能，据说最高能省 75% 的费用，尤其是在你老是重复问类似问题的时候，效果杠杠的！

隐式缓存是个啥？怎么帮你省钱？

这“隐式缓存”的核心思想，就是让系统自动记住你之前问过的问题，如果下次你问的问题跟之前很像，它就能直接用之前的结果，不用再重新算一遍，这样就省下了计算的费用。谷歌说了，这个功能默认是打开的，Gemini 2.5 Pro 和 2.5 Flash 模型都能用。你就正常用，如果你的请求和之前的请求开头部分一样，就可能命中缓存，费用就下来啦！

以前也有缓存功能，叫“显式缓存”，得你自己手动设置，哪些问题需要缓存。很多人嫌麻烦，而且最近 API 费用涨价，大家意见很大。这“隐式缓存”就好多了，不用你操心，自动搞定！

隐式缓存，好处多多！

这玩意最大的优点，就是自动！谷歌说了，只要你的请求和之前的请求内容差不多，系统就会自动帮你省钱。你啥也不用干，就能少花钱，简直是懒人福音！

而且，触发这个自动省钱的门槛还挺低。谷歌文档上说，只需要 2048 个令牌（2.5 Pro 模型）或者 1024 个令牌（2.5 Flash 模型）的前缀相同，就能触发。令牌是 AI 模型用来理解你输入内容的单位，大概 1000 个令牌相当于 750 个单词。也就是说，你随便问点啥，就可能省钱！

想省更多钱？这几招要记牢！

想让“隐式缓存”更好地工作，谷歌建议你把经常重复用的内容放在请求的开头，这样命中缓存的几率就更高。而那些每次都不一样的内容，就放在请求的结尾。

虽然谷歌对这个“隐式缓存”信心满满，但毕竟是新东西，效果还有待验证。大家用的时候，还是留个心眼。等用的人多了，反馈多了，我们就能知道这玩意到底有多给力了！

总而言之小编认为，谷歌的“隐式缓存”功能，确实给开发者们提供了一个省钱的新办法。现在 AI 模型用起来越来越贵，这个新功能对开发者来说，绝对是个好消息。以后效果怎么样，还得看大家的反馈！

更多AI行业最新资讯新闻信息（ai界最新新闻）请关注AI 人工智能网站--AITOP100平台--AI资讯

0

0

文章来源：AI TOP100

免责声明：本文不代表本平台立场，且不构成投资建议，请谨慎对待。

全部评论

暂无评论

相关AI工具

谷歌Gemini

热点资讯

每日AI资讯-2025年12月01日

每日AI资讯-2025年12月01日

每日AI资讯-2025年12月02日

每日AI资讯-2025年12月02日

每日AI资讯-2025年11月26日

每日AI资讯-2025年11月26日

每日AI资讯-2025年12月03日

每日AI资讯-2025年12月03日

来画发布全国首个支持1000秒AI漫剧平台，一键生成动漫短片

来画发布全国首个支持1000秒AI漫剧平台，一键生成动漫短片

分享

0

0

欢迎来到AI Top100！我们聚合全球500+款AI智能软件，提供最新资讯、热门课程和活动。我们致力于打造最专业的信息平台，让您轻松了解全球AI领域动态，并为您提供优质服务。

合作伙伴

联系我们

加入AITOP100社群

加入社群

AITOP100商务微信

商务微信

相关链接

服务及隐私政策