hing

首页

hing

列表

默认

浏览次数

发布日期

LLM 推理优化（Batching、Cache、Speculative Decoding 与验证）

LLM 推理优化（Batching、Cache、Speculative Decoding 与验证）

总结大模型推理的性能优化方法，包括批处理、缓存与推测解码，并提供可验证的压测与观测路径。

性能优化 2026年02月13日 0 点赞 0 评论 14 浏览

GraphQL 联邦与 Schema Stitching（边界、网关与所有权）

GraphQL 联邦与 Schema Stitching（边界、网关与所有权）

对比 Apollo Federation 与 Schema Stitching，明确服务边界与所有权，通过网关组合模式实现可扩展与治理的

软件测试 2026年02月20日 0 点赞 0 评论 5 浏览

微信公众账号

微信扫一扫加关注