数据科学与AI

首页

软件

数据科学与AI

列表

默认

浏览次数

发布时间

ClickHouse物化视图与聚合表治理

ClickHouse物化视图与聚合表治理

使用物化视图与聚合表在写入路径预聚合数据，优化查询性能与成本，规范更新与修复策略。

数据科学与AI 2026年02月14日 0 点赞 0 评论 17 浏览

Git子模块与外部仓库依赖治理（commit pin-只读-审计）最佳实践

Git子模块与外部仓库依赖治理（commit pin-只读-审计）最佳实践

通过子模块来源白名单与不可变提交引用，实施只读访问与审计，降低外部仓库依赖的安全风险。

数据科学与AI 2026年02月20日 0 点赞 0 评论 17 浏览

前端数据变更日志与回滚策略

前端数据变更日志与回滚策略

`title: 前端数据变更日志与回滚策略``categories: Web 开发/前端/数据管理``keywords: 回滚,变更日志,IndexedDB,版本,一致性``description: 在前端记录数据变更日志并支持指定版本的回滚与重放，结合 IndexedDB 存储变更条目与版本标记，

数据科学与AI 2026年02月13日 0 点赞 0 评论 17 浏览

浏览器存储配额管理与数据淘汰策略

浏览器存储配额管理与数据淘汰策略

数据科学与AI 2026年02月13日 0 点赞 0 评论 17 浏览

数据仓库建模：星型与雪花模型权衡（2025）

数据仓库建模：星型与雪花模型权衡（2025）

数据仓库建模：星型与雪花模型权衡（2025）合理的建模提升分析性能与可维护性，避免过度复杂化或冗余。一、模型与特征星型：维度扁平化，查询简单但冗余更高。雪花：维度规范化，冗余低但查询复杂。二、维度与事实维度设计：层级与缓慢变化维（SCD）治理。事实表：粒度与度量与外键设计。三、查询与性能预聚合与物化

数据科学与AI 2026年02月13日 0 点赞 0 评论 17 浏览

数据湖查询加速：Materialized Views 与 Cache 层（2025）

数据湖查询加速：Materialized Views 与 Cache 层（2025）

数据湖查询加速：Materialized Views 与 Cache 层（2025）对热点与复杂查询进行预计算与缓存能显著提升响应速度。一、物化与预聚合物化视图：对复杂聚合结果进行持久化与增量刷新。预聚合：按常见维度构建汇总表，降低运行时计算。二、缓存与层次多级缓存：引擎缓存/分布式缓存/边缘缓存协

数据科学与AI 2026年02月13日 0 点赞 0 评论 17 浏览

数据脱敏与隐私计算实践（2025）

数据脱敏与隐私计算实践（2025）

数据脱敏与隐私计算实践（2025）隐私保护要求在采集、存储与使用全链路实施技术与治理手段。一、脱敏与匿名化掩码与替换：对敏感字段进行掩码与伪值替换。泛化与聚合：按范围与分组降低识别风险。二、差分隐私与采样差分隐私：在统计输出添加噪声以保护个体隐私。采样与阈值：控制最小样本与门槛避免过拟合与泄露。三、

数据科学与AI 2026年02月13日 0 点赞 0 评论 17 浏览

数据归档治理（2025）

数据归档治理（2025）

ClickHouse MergeTree 分区与 TTL/数据归档治理（2025）一、表设计与索引主键与排序键：根据查询模式选择高选择性列；避免宽主键导致写放大。索引：跳表（data skipping）与稀疏索引减少扫描；控制 granularity。二、分区与并行分区：按时间或租户分区，提升删除与

数据科学与AI 2026年02月14日 0 点赞 0 评论 18 浏览

Delta Lake ACID与时光回溯实践

Delta Lake ACID与时光回溯实践

在Lakehouse中使用Delta Lake实现ACID写入与时光回溯，提供可验证的Spark/SQL示例与维护命令。

数据科学与AI 2026年02月14日 0 点赞 0 评论 18 浏览

数据脱敏与日志治理（字段级红线/结构化）最佳实践

数据脱敏与日志治理（字段级红线/结构化）最佳实践

以字段级红线与结构化日志治理为核心，统一脱敏与白名单策略，保障隐私不外泄并提升可观测与审计能力。

数据科学与AI 2026年02月13日 0 点赞 0 评论 18 浏览

微信公众账号

微信扫一扫加关注