技术教程

Flink 事件时间与水位线深度实践(2025)

# Flink 事件时间与水位线深度实践(2025) 事件时间驱动窗口是 Flink 的核心能力。本文聚焦乱序与迟到数据的工程实践。 ## 一、事件时间与水位线 - 事件时间:以事件携带时间戳驱动计算,避免处理时间偏差。 - 水位线(Watermark):标示低于某时间的事件基本到齐,推进窗口触发。 ## 二、乱序与迟到数据 - 乱序容忍:设置最大乱序延迟,缓解事件到达无序。 - 迟到处理:

Deno JSR 注册表:TypeScript 优先的跨运行时分发

引言 - JSR 旨在为现代 JavaScript/TypeScript 提供更合适的分发机制:原生接受 TS、只支持 ESM、跨 Node/Deno/Bun/浏览器运行时。 核心能力(已验证) - TypeScript 优先与仅 ESM:简化分发,提升类型与模块系统的一致性。来源:Deno 中文博客与英文公告。 - 包管理器协作:Deno 提供 `deno install/add/remo

Delta Lake Z-Order 与数据跳跃优化(2025)

# Delta Lake Z-Order 与数据跳跃优化(2025) ## 一、Z-Order 与布局 - Z-Order:多维排序优化数据局部性,提升剪枝效率。 - 布局策略:按查询维度排序与分区协同优化。 ## 二、数据跳跃与统计 - 数据跳跃:维护文件级统计,跳过无关数据块。 - 统计刷新:在批量写入后刷新统计与索引。 ## 三、小文件与合并 - Compaction:合并与重写小文件