工程实践
大模型推理优化-KV Cache与量化并行
"总结大模型推理的核心优化技术,从KV Cache到量化与并行策略,提升吞吐与降低延迟。"
字体预加载与 CORS:link rel=preload 的跨域与 MIME 要求
"总结字体预加载的正确使用方式与跨域要求,解释 `crossorigin` 与 `font/woff2` MIME 的必要性,并给出在 PWA 与 CDN 场景下的工程实践。"
Redis 7.4 版本解读:安全修复、流与哈希子键过期
汇总 Redis 7.4 的关键更新,包含 Lua/ACL 安全修复、Streams 的 `XREAD +` 新起点与哈希字段过期机制,并给出性能与资源优化建议。
RedisBloom过滤器实践:去重与存在性校验
使用 RedisBloom 的布隆与计数/布谷滤波器进行存在性判断与去重,在高并发场景降低存储与延迟。
Redis延迟队列与可靠消费实践
基于 Redis Streams 与 ZSET 的延迟与可靠消费模型,覆盖调度、重试、幂等与可观测治理。
S3 Select与Parquet:对象内查询与成本优化
利用 S3 Select 在对象内执行过滤与投影,结合 Parquet 列式存储降低传输与成本,优化数据访问。
S3清单与批量操作:清单报告与Batch Operations治理
使用清单报告与批量操作管理大规模对象,统一筛选与批处理策略,在合规与成本间平衡效率。
Sentry与OpenTelemetry整合:错误与事务追踪
将 Sentry 的错误监控与 OTel 追踪/指标整合,建立跨前后端的统一观测与定位能力。
