---
title: LLM 输出去敏与审计流水(PII Redaction、审计与验证)
date: 2025-11-26
keywords:
- PII Redaction
- 审计流水
- Masking
- 合规
- 日志
description: 为LLM输出进行PII去敏与审计记录,通过规则与模型识别敏感信息并替换,保留审计流水与证据链,提供实现与验证方法。
categories:
- 文章资讯
- 技术教程
---
概述
在合规场景下需对模型输出进行敏感信息过滤与审计。通过规则与NLP识别PII并掩码,记录决策与上下文以供追溯与合规检查。
关键实践与参数
- 识别器: 正则与NER组合识别电话号码、邮箱、地址等
- 掩码规则:
或部分掩码, 保持可读性 - 审计: 记录原文哈希与去敏后文本、规则命中
- 存储: 只保留哈希与必要字段, 避免泄露
示例/配置/实现
function redactPII(text) {
const rules = [
{ re: /\b\d{3}-\d{3}-\d{4}\b/g, mask: '***-***-****' },
{ re: /[\w._%+-]+@[\w.-]+\.[A-Za-z]{2,}/g, mask: '[redacted-email]' }
]
let out = text, hits = []
for (const r of rules) { if (r.re.test(out)) { hits.push(r.re.source); out = out.replace(r.re, r.mask) } }
return { out, hits }
}
function audit(original, redacted, hits) { return { ts: Date.now(), original_hash: crypto.createHash('sha256').update(original).digest('hex'), hits, redacted } }
验证
- 准确度: 常见PII被正确替换, 误报率可接受
- 审计完整: 决策与原文哈希记录可追溯
- 合规: 存储不泄露敏感原文
- 性能: 在流式场景下延迟可控
注意事项
- 覆盖更多类型的PII需持续优化规则与模型
- 合规区域差异需适配
- 审计日志需加密与访问控制
- 与Guardrails与Schema校验协同

发表评论 取消回复