调度 - 叶斌兵

GPU 调度与 AI 推理成本优化（2025）

GPU 调度与 AI 推理成本优化（2025）推理服务成本受批量与并发与精度等影响，需在性能与体验之间平衡。一、批处理与并发批处理：提升吞吐但增加延迟；按场景权衡批大小。并发调度：控制并发队列与优先级，避免拥塞与抖动。二、精度与算子混合精度：FP16/BF16 在可接受损失下提升性能。算子优化：选择

声学与音频 2026年02月20日 0 点赞 0 评论 4 浏览

Fetch Priority：fetchpriority 与资源调度优化

使用 fetchpriority 为关键资源提供优先级提示，优化首屏与关键路径加载；结合实测与 DevTools 验证效果。

消息队列 2026年02月20日 0 点赞 0 评论 5 浏览

Kubernetes Topology Spread Constraints与反亲和实践

通过TopologySpreadConstraints与反亲和规则在不同拓扑域均衡Pod分布，提供可验证的YAML与命令，提升可用性与稳定性。

云与容器 2026年02月13日 0 点赞 0 评论 7 浏览

Kubernetes调度：NodeAffinity/Taints与拓扑扩散约束

使用亲和/污点与拓扑扩散在调度层治理工作负载分布与隔离，提升可用性与资源利用率。

云与容器 2026年02月13日 0 点赞 0 评论 9 浏览

NVIDIA Triton Inference Server 模型仓库与调度治理（2025）

NVIDIA Triton Inference Server 模型仓库与调度治理（2025）一、模型仓库与版本仓库：统一模型仓库布局；记录版本与配置（模型仓库）。热加载：支持在线加载/卸载；灰度发布与回滚。二、并发与批处理并发：设置实例与并发（并发）；限制热点模型资源。Batch：启用动态批处理（B

数据科学与AI 2026年02月13日 0 点赞 0 评论 9 浏览

HTTP/2优先级与请求调度治理

理解 HTTP/2 的优先级与调度在现实中的约束，结合应用层提示与服务器策略，优化关键资源加载时序。

网络与协议 2026年02月12日 0 点赞 0 评论 10 浏览

Kubernetes Cluster Autoscaler 与资源成本优化实践

通过 Cluster Autoscaler 的节点自动伸缩与策略优化，验证成本与可用性平衡的实操方案

性能优化 2026年02月13日 0 点赞 0 评论 11 浏览

Periodic Background Sync 定时离线任务调度实践

`title: Periodic Background Sync 定时离线任务调度实践``categories: Web 开发/前端/数据管理``keywords: Periodic Background Sync,Service Worker,离线,调度,同步``description: 使用 P

工程实践 2026年02月13日 0 点赞 0 评论 11 浏览

Kubernetes Taints 与 Tolerations（节点调度与验证）

使用节点污点与Pod容忍控制工作负载调度与隔离，在混合节点与隔离场景中提升可靠性，提供配置与验证方法。

云与容器 2026年02月13日 0 点赞 0 评论 11 浏览

Karpenter与Cluster Autoscaler对比：弹性供给与成本治理

对比 Karpenter 与 CA 在节点供给与弹性策略上的差异，优化启动时延、亲和与成本治理，提升集群效率。

软件 2026年02月12日 0 点赞 0 评论 11 浏览

调度

首页

调度

列表

默认

浏览次数

发布日期