数据科学与AI

边缘计算:赋能物联网与实时数据处理

"本文深入探讨边缘计算的核心概念、工作原理、关键技术及其在物联网(IoT)、5G、工业自动化等领域的应用。通过分析边缘计算如何解决传统云计算在延迟、带宽和数据隐私方面的挑战,展示其在未来智能世界中的重要作用。"

前端监控与 RUM 数据采集最佳实践

概述真实用户监控(RUM)通过在生产环境采集关键体验指标与错误事件,为性能与稳定性提供数据闭环。本文聚焦采集、采样与数据质量保障。已验证技术参数以 75th 百分位作为性能目标评估标准,反映大多数用户体验推荐使用 `PerformanceObserver` 采集 LCP/CLS/INP、资源与长任务

数据发现与数据目录平台实践(2025)

数据发现与数据目录平台实践(2025)数据目录让数据资产可见可用。本文从模型、搜索与治理展开。一、模型与采集元数据模型:覆盖数据集、字段、任务与责任人。采集:在 ETL、流处理与查询层自动采集与更新。二、搜索与标签搜索:按名称、字段与标签与血缘进行检索。标签:统一标签体系与权限,支持业务域分类。三、

湖仓一体数据治理实践(2025)

湖仓一体数据治理实践(2025)湖仓一体结合数据湖的灵活性与数仓的治理能力。本文聚焦表格式选型、数据一致性与治理方法。一、表格式与兼容Iceberg/Delta Lake:提供表级元数据、快照与 ACID 语义。计算引擎:兼容 Spark、Flink、Trino 等主流生态。分区与索引:合理的分区策