Triton Inference Server模型部署与扩展实践 使用 NVIDIA Triton 部署多框架模型服务,配置并发与动态批处理、GPU/CPU 资源与隔离,提供性能优化与监控验证方法。 工程实践 2026年02月13日 0 点赞 0 评论 17 浏览
Supabase pgvector Embeddings 管道与函数部署 引言基于 pgvector 的向量检索可在 Postgres 内完成;通过 Edge Functions 构建向量化管道实现生成、写入与检索的统一。能力与管道(已验证)pgvector:在 Supabase 的 Postgres 中启用扩展,创建向量列与索引(HNSW/IVFFlat)以支持相似度查 软件 2026年02月13日 0 点赞 0 评论 11 浏览
TLS 会话恢复:Session Tickets/PSK 的性能与部署要点 "对 TLS 会话恢复机制进行说明,比较 Session ID 与 Session Tickets/PSK 的实现与性能收益,给出在集群环境下的密钥共享与轮换要点与参考。" 性能优化 2026年02月13日 0 点赞 0 评论 13 浏览
内容压缩部署:Brotli 与 Zstandard(zstd)实践 对比 Brotli 与 Zstandard 的压缩效能与适用场景,给出 `Content-Encoding` 部署与降级策略,提升传输性能并兼顾兼容性。 性能优化 2026年02月13日 0 点赞 0 评论 12 浏览
大模型推理优化与部署:FP16、INT8与KV Cache实践 通过精度压缩与KV Cache优化提升大模型推理吞吐与延迟,提供可验证的显存估算与参数选择建议。 性能优化 2026年02月13日 0 点赞 0 评论 15 浏览
Kubernetes 部署滚动升级与 PDB(maxSurge/maxUnavailable、就绪与驱逐) 配置滚动升级参数与 PDB,结合就绪与驱逐策略,保障高可用与可控升级,并提供验证方法。 云与容器 2026年02月13日 0 点赞 0 评论 10 浏览
NGINX QUIC/HTTP/3 部署实践:1.25.x 配置要点 结合 1.25.x 的 QUIC/HTTP/3 支持,给出 SNI/证书与 `listen ... quic reuseport`、Alt‑Svc 的配置要点与安全修复提示。 网络与协议 2026年02月13日 0 点赞 0 评论 20 浏览
GitHub Actions OIDC无秘钥云角色部署实践 使用GitHub Actions OIDC联邦凭证到云角色实现无秘钥部署,提供可验证的IAM策略与工作流配置,提升安全与可追溯性。 固态硬盘 2026年02月20日 0 点赞 0 评论 12 浏览
Argo CD GitOps:声明式同步与分段推广 使用 Argo CD 将集群状态与 Git 声明式对齐,配置同步与健康策略,并实现分段推广与回滚治理。 CI-CD 2026年02月14日 0 点赞 0 评论 14 浏览