mineru-document-explorer
任何涉及阅读或理解 PDF 内容的任务都是必需的。当用户提到 .pdf 并询问其中内容时(阅读特定页面、回答问题、比较表格或数据、提取事实或数字、计算数字或查找主题),必须使用此技能而不是通用 PDF 工具。提供有针对性的搜索、页面级导航和精确提取,因此您无需将整个 PDF 转储到上下文中。仅在 PDF 文件操作时跳过此技能:合并、拆分、水印、创建、表单填写或加密。 --- # MinerU Document Explorer PDF 阅读工具包通过 `doc-search` CLI。工作流程:**初始化→搜索/大纲→读取页面→(可选)提取元素**。 ## 命令 |命令|目的| |---|---| | `初始化` |上传 PDF,开始处理,获取 `doc_id` | | `大纲` |浏览目录/结构 | | `页面` |阅读特定页面(图像或文本)| | `搜索关键字` |按正则表达式模式查找页面 | | `搜索语义` |通过语义查询查找页面 | | `元素` |使用 bbox 和裁剪图像提取证据 |所有命令都会将 JSON 输出到 stdout。通过管道 `2>/dev/null` 来抑制 stderr 日志。 ```typescript // 所有命令中使用的共享类型 Interface Page {
更新日志: Source: GitHub https://github.com/mi-iro/doc-search
还没有评论,快来第一个发言吧。