法律文件脱敏处理

Category: Tools & Productivity | Uploader: moyupeng0422moyupeng0422 | Downloads: 0 | Version: v1.0(Latest)

法律文件脱敏/还原工具 - 将法律文档中的敏感信息进行智能替换和脱敏处理,或将脱敏稿还原为原文 <examples> - 帮我把这份合同脱敏处理 - 我需要脱敏这个法律文件 - 生成脱敏版本的合同文档 - 将这份法律文书中的敏感信息替换掉 - 创建合同的脱敏版本 - 帮我把脱敏稿还原成原文 - 使用比对词还原审核稿 </examples> --- # 法律文件脱敏处理 将法律文档中的敏感信息进行智能替换和脱敏处理,生成可对外分享的脱敏版本。支持将脱敏稿交由外部审核后,使用比对词还原为原文。 ## 核心功能 ### 脱敏功能 - **多种脱敏类型**:名称、日期、价格、文件名、项目名、银行账号、案号等 - **自定义脱敏类型**:创建自定义类型(如"合同名称"、"产品型号"),批量输入精准匹配内容 - **批量模式**:多文件上传自动进入批量模式,统一编号确保跨文件一致性 - **规则设置**:可自主开启/关闭16种内置脱敏类别,灵活控制识别范围 - **智能替换**:根据上下文识别角色(买方/卖方公司) - **实时预览**:黄色高亮显示脱敏内容 - **格式保留**:完整保留原文格式(段落、表格、字体) - **白名单/黑名单管理**:精确控制特定内容的脱敏行为;黑名单支持记录项目类型 - **优先级机制**:黑名单 > 白名单 > 脱敏类别(内置+自定义) - **冲突检测**:添加到列表时自动检测是否已存在于其他列表 - **调试模式**:详细日志输出,便于排查问题 ### 还原功能 - **自动化还原**:根据比对词自动将【X】标记还原为原文 - **批量还原**:支持多文件同时还原,自动匹配文件配对,ZIP打包下载 - **保留审核痕迹**:还原时保留文档中的修订、批注等审核痕迹 - **runs级别替换**:精确替换,不影响其他内容的格式 ## 使用方式 ### HTML离线工具(推荐) #### 脱敏模式 **单文件脱敏:** 1. 打开 `assets/index.html`,选择"脱敏模式" 2. 拖拽或选择单个 docx 文件上传 3. 自动识别并预览脱敏效果 4. 手动编辑脱敏项 5. 导出脱敏文件和比对.md文档 **批量脱敏:** 1. 上传多个 docx 文件,自动进入批量模式 2. 统一识别:相同内容使用相同替换文本 3. 文件切换:通过列表栏切换查看各文件 4. 同步编辑:删除/添加脱敏项会同步到所有文件 5. 导出结果:每个文件生成独立的 `{文件名}_比对.md` #### 还原模式 **单文件还原:** 1. 打开 `assets/index.html`,选择"还原模式" 2. 上传脱敏稿(带审核痕迹的docx) 3. 上传对应的比对.md文件 4. 点击"执行还原",自动下载还原后的文件 **批量还原(4步流程):** 1. **上传文件**:上传多个脱敏稿 + 多个比对.md文件 2. **确认配对**:系统自动匹配文件名,支持手动调整 3. **执行还原**:批量处理,显示进度条 4. **下载结果**:ZIP打包下载 ### Python脚本 ```bash # 安装依赖 pip install python-docx # 执行脱敏 python scripts/redact.py input.docx data/rules.json -o output.docx # 执行还原(保留修订、批注) python scripts/restore.py redacted.docx mapping.md -o restored.docx ``` ## 详细文档 - **工作流程**: [references/workflow.md](references/workflow.md) - **规则模式库**: [references/patterns.md](references/patterns.md) - **数据格式**: [references/data-formats.md](references/data-formats.md) - **脚本使用**: [scripts/README.md](scripts/README.md) - **HTML使用**: [assets/README.md](assets/README.md) ## 版本历史 - **v1.4.0(2026-03-11)批量模式优化**: - **独立比对文件**:批量导出时每个文件生成独立的 `{文件名}_比对.md`,存放在 `比对文件/` 文件夹中 - **批量模式一致性**:相同内容在不同文件中使用相同替换文本 - **v1.3.1(2026-03-02)规则开关控制**: - 新增"规则设置"功能:可自

Changelog: Source: GitHub https://github.com/moyupeng0422/legal-doc-redactor

Directory Structure

Current level: Root

SKILL.md

Login to download/like/favorite ❤ 30 | ★ 0
Comments 0

Please login before commenting.

No comments yet. Be the first one!