Obsidian笔记里,图片总是“隐形人”?
各位Obsidian用户,有没有同感?在咱们的数字笔记世界里,文字永远是主角,图片就像个不受待见的小透明,躲在角落里瑟瑟发抖。作为一名 AI 研究生,同时也是 Obsidian 的深度用户,我早就受够这种不平衡了!知识管理嘛,光顾着文本处理,把图片这个重要的信息载体扔一边,这说得过去吗?
好消息是,随着计算机视觉技术的突飞猛进,咱们终于有机会打破这个僵局,让图片在 Obsidian 里也能风生水起!经过我这几个礼拜的摸索和实践,我总结了几种超给力的 AI 工具和方法,保证能彻底改变你处理图片的方式。
为啥说图片是知识管理里的“隐形人”?
计算机这玩意儿,天生就对文字敏感。虽然现在啥媒体素材都能显示,但要让它理解像素背后的含义,就有点儿强人所难了。所以,大多数笔记软件,包括 Obsidian,对图片的支持都比较弱鸡。
就拿 Obsidian 来说,它不支持图像编辑、缩放、对齐,更别提啥图像管理功能了。想引用之前用过的图片?你只能老老实实地去附件文件夹里翻,简直是原始社会!
但是,都 2024 年了,计算机视觉这么火,再忽视图片就说不过去了。好在 Obsidian 的可定制性很强,给了咱们巨大的改造空间!
OCR:让图片里的文字“活”过来!
OCR(光学字符识别)绝对是计算机视觉里最成熟、最实用的技术之一。有了它,扫描版 PDF、禁止复制的网站,统统不在话下!
现在的 OCR 模型,跑在本地都没问题,早就是“标配”了。虽然 Obsidian 有不少 OCR 插件,但我总觉得这玩意儿应该全局调用才方便。
我强烈推荐 Pixpin 这款截图神器!它集成了截图、长截图、录屏、取色、OCR、图像编辑等一系列功能,而且对普通用户完全免费!使用方法简单到爆:按下截图键 Ctrl+1,框选屏幕上的文字,再按 Shift+C,文字就复制到剪贴板了!
如果你愿意开个 Pixpin 会员(年费平均每月 6.66 元,或者 198 元买断),还能复制表格到 Excel,以及截图翻译。最重要的是,Pixpin 免费版没广告,功能也够用,完全能满足日常需求。
LaTeX OCR:数学公式识别的福音!
相比普通文本,识别数学公式并转化为 LaTeX 代码,难度可不是一个级别。数学公式介于文本和图画之间,模型不仅要识别符号,还要理解符号之间的位置关系,然后映射到 LaTeX 代码结构。
市面上好用的 LaTeX OCR 工具,比如 Mathpix,免费版一个月只能识别 10 次(教育优惠 20 次),Pro 版要 4.99 美元/月,而且还有次数限制。对于咱们学生党来说,有点儿肉疼。
别担心,我们可以自己部署 LaTeX 公式识别模型,实现免费且高效的识别!首先,在 Obsidian 里安装 Image2LaTEX 插件,然后选择合适的后端服务。
我强烈推荐 pix2tex 作为后端。如果你安装了 Docker,只需运行以下命令:
然后在插件设置里填入 URL( https://localhost:8502/predict ),就可以愉快地使用公式识别服务了。pix2tex 能够精准识别多行公式,但对于复杂矩阵的识别能力稍逊一筹。如果你经常需要识别大型矩阵或 LaTeX 表格,Mathpix 仍然是不错的选择。
图像搜索:让图片不再“查无此图”!
OCR 只能识别图片里的文字,但没法理解其他内容。要让计算机真正理解图像,通常有两种方法:一是将图片编码为向量,用于图像分类和搜索;二是用文字描述图像内容(图生文),然后用这段文字替代图像进行搜索。
虽然图像搜索的技术含量很高,但 Obsidian 的搜索插件 Omnisearch 已经支持基于图生文的图像搜索了!要实现这个功能,我们需要安装 AI Image Analysis Plugin,它支持使用多模态大模型为图像生成文字描述索引。
这个插件推荐使用 Ollama 托管模型,它是一个高效的本地大模型推理引擎,可以大幅压缩模型所需的资源。安装步骤如下:
然后在插件设置里填入 URL( https://localhost:11434/ ),选择模型并下载。索引建立完成后,Omnisearch 就能搜索图像了。注意,如果用中文搜索,需要把插件设置里的 prompt 改成中文,不然搜不到!
除了图生文搜索,Omnisearch 还支持搜索图像中的文字。它可以使用 Text Extractor 插件 OCR 识别图像中的文本,并将其作为索引进行搜索。
总结:告别“图文分离”,拥抱更高效的知识管理!
图文结合是效率最高的的信息传递方式,咱们的笔记数据也几乎都采用这种形式。然而,作为“图文”中的“图”,图片一直被忽视,难以管理和编辑,几乎和文字完全分离,也无法搜索,实在是太不方便了!
有了 OCR 和图生文等 AI 技术,咱们终于可以打破文字与图像之间的壁垒,将图像真正纳入知识管理体系,让我们的笔记系统更加完整、高效!这不仅提升了信息检索的便捷性,也为知识管理开辟了全新的维度!