baoxiao
处理报销发票识别、归类和数据提取的自动化流程。当用户需要处理发票文件、 填写报销表格、识别发票类型(机票、火车、住宿、滴滴等)、提取发票金额和日期时, 必须使用此技能。适用于财务报销、差旅费统计、发票管理等场景。 触发场景: - 用户提到"发票"、"报销"、"baoxiao"、"差旅费"等关键词 - 需要填写报销表格(如biaoge.xlsx) - 需要识别PDF发票并提取金额、日期 - 需要按类型归类发票文件 - 需要验证发票数据的合理性 --- # 报销发票处理技能 (Baoxiao) ## 概述 本技能提供完整的发票处理流程,包括: 1. OFD文件自动转换为PDF 2. 发票文件自动识别与归类 3. 关键数据提取(金额、日期、城市名称) 4. 数据合理性校验 5. Excel表格自动填写(含城市信息) 6. Word审批文档自动填写 7. PDF转换和合并 ## 前置要求 必须安装以下工具,先检查用户环境是否满足,不满足需要执行安装: ```bash # PDF处理 pip3 install pdfplumber pdf2image pypytesseract pillow openpyxl pandas python-docx reportlab pypdf pypdf2 # YAML配置支持 (用于读取 config.yaml 配置文件) apt-get install python3-yaml # OCR引擎 apt-get install tesseract-ocr tesseract-ocr-chi-sim poppler-utils # PDF转换(用于Excel/Word转PDF) apt-get install libreoffice-writer libreoffice-calc ``` 字体依赖, 识别中文发票需要安装常见的字体,如宋体、楷体、黑体、仿宋、仿宋_GB2312、方正小标宋简体、Arial等. ## 配置说明 ### 城市单位映射配置 工具通过**配置文件**或**命令行参数**获取城市到单位的映射,用于自动填写Word审批文档中的"到达单位"字段。 #### 方式1:配置文件(推荐) 1. **创建配置文件** ```bash cp config.example.yaml config.yaml ``` 2. **编辑配置内容** ```yaml # config.yaml
Changelog: Source: GitHub https://github.com/GJoge/skill-baoxiao
No comments yet. Be the first one!