--- title: LLM 输出去敏与审计流水(PII Redaction、审计与验证) date: 2025-11-26 keywords: - PII Redaction - 审计流水 - Masking - 合规 - 日志 description: 为LLM输出进行PII去敏与审计记录,通过规则与模型识别敏感信息并替换,保留审计流水与证据链,提供实现与验证方法。 categories: - 文章资讯 - 技术教程 --- ## 概述 在合规场景下需对模型输出进行敏感信息过滤与审计。通过规则与NLP识别PII并掩码,记录决策与上下文以供追溯与合规检查。 ## 关键实践与参数 - 识别器: 正则与NER组合识别电话号码、邮箱、地址等 - 掩码规则: `****` 或部分掩码, 保持可读性 - 审计: 记录原文哈希与去敏后文本、规则命中 - 存储: 只保留哈希与必要字段, 避免泄露 ## 示例/配置/实现 ```js function redactPII(text) { const rules = [ { re: /\b\d{3}-\d{3}-\d{4}\b/g, mask: '***-***-****' }, { re: /[\w._%+-]+@[\w.-]+\.[A-Za-z]{2,}/g, mask: '[redacted-email]' } ] let out = text, hits = [] for (const r of rules) { if (r.re.test(out)) { hits.push(r.re.source); out = out.replace(r.re, r.mask) } } return { out, hits } } function audit(original, redacted, hits) { return { ts: Date.now(), original_hash: crypto.createHash('sha256').update(original).digest('hex'), hits, redacted } } ``` ## 验证 - 准确度: 常见PII被正确替换, 误报率可接受 - 审计完整: 决策与原文哈希记录可追溯 - 合规: 存储不泄露敏感原文 - 性能: 在流式场景下延迟可控 ## 注意事项 - 覆盖更多类型的PII需持续优化规则与模型 - 合规区域差异需适配 - 审计日志需加密与访问控制 - 与Guardrails与Schema校验协同

发表评论 取消回复