PillOCR - 一个基于大模型 API 的 OCR 工具

https://github.com/OB0NE/PillOCR

PillOCR 是一个基于大模型 API 的 OCR 工具。

它会自动监听剪贴板中的图片,将其发送给大模型进行识别,并将识别结果粘贴回剪贴板,为那些在连续写作时需要频繁进行公式识别的用户提供一种更加无感的体验。

轻量化设计,不需要在本地进行图片识别,对电脑算力要求不高
价格便宜,使用大模型 API 进行识别,成本较低
模型可替换,不依赖于某一家提供商,可以根据需求选择合适的模型
未来可能会增加支持 MathML 和 Typst 的功能,以及识别 + 翻译等功能

#OCR #Tool #GitHub #AI
#GitHub #OCR #API

📁 pdf-extract-api - 高精度文档解析和提取 API

▎项目功能:文档解析和提取

▎项目介绍:一个文档解析和提取 API,支持将 PDF 或图片文件转换为结构化的 JSON 或 Markdown 格式。

它利用了先进的 OCR 技术和 Ollama 支持的语言模型来实现高精度文本转换和去除敏感信息。

支持离线运行、分布式任务处理、Redis 缓存、CLI 操作工具以及对图片中的表格、数学公式的处理。

▎项目地址:点击打开
 
 
Back to Top