数据

数据血缘与元数据治理(2025)

数据血缘与元数据治理(2025)数据血缘揭示数据从源到用的路径,元数据治理提升数据资产的可见性与一致性。一、元数据模型与目录(Catalog)范畴:数据集、字段、任务与调度;统一命名与标签。可视化:以目录与关系图呈现依赖与责任归属。二、血缘采集与存储采集:在 ETL/ELT、流处理与查询层植入血缘事

数据脱敏与隐私计算实践(2025)

数据脱敏与隐私计算实践(2025)隐私保护要求在采集、存储与使用全链路实施技术与治理手段。一、脱敏与匿名化掩码与替换:对敏感字段进行掩码与伪值替换。泛化与聚合:按范围与分组降低识别风险。二、差分隐私与采样差分隐私:在统计输出添加噪声以保护个体隐私。采样与阈值:控制最小样本与门槛避免过拟合与泄露。三、