在信息爆炸的时代,我们每天都会接触到海量的图像信息,从课堂上的黑板板书,到教科书里的扫描页,再到街头巷尾的广告牌。但如何高效地整理和检索这些图像中的内容,却成了不少人的难题。
2025年11月15日,谷歌宣布NotebookLM迎来重大升级,新增图像数据源功能,让图像秒变可检索的知识库!
工具地址:NotebookLM网页版官网 (海外网站需要科学上网)

图像导入新技能:OCR+语义解析,自然语言轻松检索
这次NotebookLM的升级,最吸引人的莫过于图像数据源的加入。用户只需上传黑板板书、教科书扫描页或者街拍表格等图像,系统就会自动完成OCR(光学字符识别)和语义解析。这意味着,无论是手写还是印刷的文字,无论是表格还是图表,都能被系统精准识别并转化为可检索的文本信息。
更厉害的是,用户还可以用自然语言直接检索图中的内容。比如,你拍摄了一张课堂板书,然后提问:“左下角的公式是怎么推导的?”系统就能即时定位到公式,并生成详细的推导步骤讲解。这种智能化的检索方式,让知识获取变得前所未有的便捷。
多模态模型加持:手写印刷分得清,表格结构轻松提
NotebookLM新版之所以能实现如此强大的图像检索功能,离不开其底层的多模态模型。这个模型能够分辨手写与印刷区域,提取表格结构,并与用户已有的文本、音频、视频笔记自动关联。这样一来,用户的知识库就变得更加丰富和立体了。
谷歌在演示中展示了多个用例,让人印象深刻。比如,扫描教材第127页的表格后,用户可以直接查询某个单元格的数值;上传街头咖啡店的菜单,就能轻松提取拿铁的价格信息。这些功能不仅适用于学习场景,还能在日常工作中发挥巨大作用。
教育账号热情高涨:48小时上传图像量破50万页
NotebookLM的图像导入功能一经推出,就受到了广大用户的热烈欢迎。据谷歌统计,功能上线后的48小时内,教育账号上传的图像量就突破了50万页,环比增加了340%!这一数据充分说明了用户对这一功能的认可和需求。
为了满足更多用户的需求,谷歌还计划在未来数周内追加本地处理选项。这样一来,用户就可以选择将敏感资料留在本地处理,减少上传云端的担忧。这一举措无疑将进一步提升用户的使用体验。
未来发展:AR眼镜实时拍摄接口,所见即所问
除了现有的功能升级外,谷歌还为NotebookLM规划了更加宏伟的蓝图。公司计划明年为NotebookLM集成AR眼镜实时拍摄接口,实现“所见即所问”的神奇体验。这意味着,用户只需戴上AR眼镜,就能实时拍摄并检索周围环境中的图像信息,让知识获取变得更加即时和直观。
目前,NotebookLM的图像处理功能仍然沿用现有的免费配额,谷歌尚未透露是否会推出付费加速通道。但无论如何,这一功能的推出已经为用户带来了实实在在的便利和价值。
NotebookLM的这次升级,无疑为知识管理和检索领域带来了新的活力和机遇。如果你还在为如何整理和检索图像中的信息而烦恼,不妨试试NotebookLM的新功能吧!相信它一定能给你带来意想不到的惊喜和收获。
想了解AITOP100平台其它版块的内容,请点击下方超链接查看
AI创作大赛 | AI活动 | AI工具集 | AI资讯专区
AITOP100平台官方交流社群二维码:









