工程实践

PyTorch-2.4训练与推理优化白皮书

技术摘要PyTorch 2.4 在编译器与运行时优化下提升 CUDA 与 GPU 执行效率;针对批处理与并发路径降低 延迟、提高 吞吐,并在能耗管理上改善 能效比,适用于训练与推理的统一优化。技术参数版本与组件:PyTorch 2.4;`torch.compile`、CUDA 后端、cuDNN 集成

Istio Ambient Mesh L4 安全与采样实践(2025)

Istio Ambient Mesh L4 安全与采样实践(2025)一、架构与组件Ambient Mesh:去 sidecar,以 `ztunnel` 在 L4 层实现路由与安全(Ambient Mesh)。分层:L4 安全与策略,必要时对特定服务启用 L7 能力。二、安全与mTLS身份:SPIF