科技资讯

GPU 调度与 AI 推理成本优化(2025)

# GPU 调度与 AI 推理成本优化(2025) 推理服务成本受批量与并发与精度等影响,需在性能与体验之间平衡。 ## 一、批处理与并发 - 批处理:提升吞吐但增加延迟;按场景权衡批大小。 - 并发调度:控制并发队列与优先级,避免拥塞与抖动。 ## 二、精度与算子 - 混合精度:FP16/BF16 在可接受损失下提升性能。 - 算子优化:选择高效算子与图优化,减少无效计算。 ## 三、观

Deno KV 会话存储与速率限制实战

引言 - Deno KV 为 Deno 提供原生键值存储与简易事务;在会话与速率限制场景下可提供低延迟与简化的持久化方案。 能力与用法(已验证) - KV 存储:支持基本读写与原子操作;可在多区域部署下使用。来源:Deno 手册与博客。 - 会话与限流:在 KV 中存储会话状态与计数器,结合 TTL 与原子递增实现限流。来源:Deno 手册。 实践建议 - 一致性评估:在多区域部署中评估

Cloudflare Analytics Engine 与 Logpush 实战

引言 - Analytics Engine 提供可查询的时序与日志数据存储;Logpush 支持将边缘日志推送到外部存储(R2/S3/BigQuery 等),组合实现端到端可观测性。 能力与用法(已验证) - Analytics Engine:通过 SQL 类语言查询 HTTP 请求、Workers 事件与自定义指标。来源:Cloudflare Docs(Analytics Engine)。

ClickHouse 物化视图实时聚合与去重治理(2025)

# ClickHouse 物化视图实时聚合与去重治理(2025) ## 一、表与视图设计 - 明细表:存储原始事件;索引按查询模式设计。 - 物化视图(物化视图):将明细写入 `AggregatingMergeTree` 进行 `实时聚合` 与 `去重`。 ## 二、聚合与去重 - 聚合函数:`sum/count/uniqExact/argMax` 等;按业务选择。 - 去重:使用 `uniq

ClickHouse 写入与查询优化(2025)

# ClickHouse 写入与查询优化(2025) ClickHouse 面向高并发分析型查询,优化重点在表引擎与数据布局与查询路径。 ## 一、表与索引 - MergeTree 家族:根据写入与查询模式选择合适引擎(如 MergeTree、ReplacingMergeTree、SummingMergeTree)。 - 主键与排序键:合理设置提升范围查询与跳过数据块效率。 ## 二、分区与