mineru
MinerU 文档提取 CLI,可通过 MinerU API 将 PDF、图像和网页转换为 Markdown、HTML、LaTeX 或 DOCX。支持无令牌闪存提取以实现快速启动、通过表格/公式识别进行精确提取、网络爬行、批处理和管道工作流程。
更新日志: Source: GitHub https://github.com/opendatalab/MinerU-Ecosystem
MinerU 文档提取 CLI,可通过 MinerU API 将 PDF、图像和网页转换为 Markdown、HTML、LaTeX 或 DOCX。支持无令牌闪存提取以实现快速启动、通过表格/公式识别进行精确提取、网络爬行、批处理和管道工作流程。
更新日志: Source: GitHub https://github.com/opendatalab/MinerU-Ecosystem
还没有评论,快来第一个发言吧。