Marker - 将 PDF 快速转换为 Markdown / JSON / HTML
https://github.com/datalab-to/marker
API 版本: https://github.com/adithya-s-k/marker-api
Marker 是一个将 PDF 文档转换为 Markdown、JSON 和 HTML 的工具,快速准确。
● 支持多种文件格式(PDF、图像、PPTX、DOCX、XLSX、HTML、EPUB)和多种语言的转换
● 格式化表格、公式、内联数学、链接、引用和代码块
● 提取和保存图像,移除页眉 / 页脚等
● 可通过 LLM 提高转换准确度
#PDF #Tool #GitHub
https://github.com/datalab-to/marker
API 版本: https://github.com/adithya-s-k/marker-api
Marker 是一个将 PDF 文档转换为 Markdown、JSON 和 HTML 的工具,快速准确。
● 支持多种文件格式(PDF、图像、PPTX、DOCX、XLSX、HTML、EPUB)和多种语言的转换
● 格式化表格、公式、内联数学、链接、引用和代码块
● 提取和保存图像,移除页眉 / 页脚等
● 可通过 LLM 提高转换准确度
#PDF #Tool #GitHub