---

title: LLM 输出去敏与审计流水(PII Redaction、审计与验证)

date: 2025-11-26

keywords:

  • PII Redaction
  • 审计流水
  • Masking
  • 合规
  • 日志

description: 为LLM输出进行PII去敏与审计记录,通过规则与模型识别敏感信息并替换,保留审计流水与证据链,提供实现与验证方法。

categories:

  • 文章资讯
  • 技术教程

---

概述

在合规场景下需对模型输出进行敏感信息过滤与审计。通过规则与NLP识别PII并掩码,记录决策与上下文以供追溯与合规检查。

关键实践与参数

  • 识别器: 正则与NER组合识别电话号码、邮箱、地址等
  • 掩码规则: 或部分掩码, 保持可读性
  • 审计: 记录原文哈希与去敏后文本、规则命中
  • 存储: 只保留哈希与必要字段, 避免泄露

示例/配置/实现

function redactPII(text) {
  const rules = [
    { re: /\b\d{3}-\d{3}-\d{4}\b/g, mask: '***-***-****' },
    { re: /[\w._%+-]+@[\w.-]+\.[A-Za-z]{2,}/g, mask: '[redacted-email]' }
  ]
  let out = text, hits = []
  for (const r of rules) { if (r.re.test(out)) { hits.push(r.re.source); out = out.replace(r.re, r.mask) } }
  return { out, hits }
}
function audit(original, redacted, hits) { return { ts: Date.now(), original_hash: crypto.createHash('sha256').update(original).digest('hex'), hits, redacted } }

验证

  • 准确度: 常见PII被正确替换, 误报率可接受
  • 审计完整: 决策与原文哈希记录可追溯
  • 合规: 存储不泄露敏感原文
  • 性能: 在流式场景下延迟可控

注意事项

  • 覆盖更多类型的PII需持续优化规则与模型
  • 合规区域差异需适配
  • 审计日志需加密与访问控制
  • 与Guardrails与Schema校验协同

点赞(0) 打赏

评论列表 共有 0 条评论

暂无评论
立即
投稿

微信公众账号

微信扫一扫加关注

发表
评论
返回
顶部