概述HPA 基于指标调整副本数;VPA 调整容器请求/限制。两者结合可在不同负载模式下实现可靠弹性。已验证技术参数HPA API:`autoscaling/v2`;支持 `Resource` 与 `Pods/External` 指标典型目标:CPU/内存利用率(如 70%)与自定义业务 QPS/延迟行为(Behavior):`stabilizationWindowSeconds` 与 `policies` 控制扩缩速度与抖动实践示例apiVersion: autoscaling/v2
kind: HorizontalPodAutoscaler
metadata:
name: web-hpa
spec:
scaleTargetRef:
apiVersion: apps/v1
kind: Deployment
name: web
minReplicas: 2
maxReplicas: 20
metrics:
- type: Resource
resource:
name: cpu
target:
type: Utilization
averageUtilization: 70
behavior:
scaleUp:
stabilizationWindowSeconds: 30
policies:
- type: Percent
value: 100
periodSeconds: 60
scaleDown:
stabilizationWindowSeconds: 60
policies:
- type: Percent
value: 50
periodSeconds: 60
治理建议为指标采集与滞后设定缓冲时间;避免误触扩缩导致抖动将业务指标纳入伸缩决策(如排队长度、错误率)结语弹性伸缩是成本与体验的平衡艺术。以行为策略与多指标驱动,构建可预测的自动化扩缩容。

发表评论 取消回复