Marker - 将 PDF 快速转换为 Markdown / JSON / HTML

https://github.com/datalab-to/marker

API 版本: https://github.com/adithya-s-k/marker-api

Marker 是一个将 PDF 文档转换为 Markdown、JSON 和 HTML 的工具,快速准确。

支持多种文件格式(PDF、图像、PPTX、DOCX、XLSX、HTML、EPUB)和多种语言的转换
格式化表格、公式、内联数学、链接、引用和代码块
提取和保存图像,移除页眉 / 页脚等
可通过 LLM 提高转换准确度

#PDF #Tool #GitHub GitHub - datalab-to/marker: Convert PDF to markdown + JSON quickly with high accuracy
 
 
Back to Top