概述HPA 基于指标调整副本数;VPA 调整容器请求/限制。两者结合可在不同负载模式下实现可靠弹性。已验证技术参数HPA API:`autoscaling/v2`;支持 `Resource` 与 `Pods/External` 指标典型目标:CPU/内存利用率(如 70%)与自定义业务 QPS/延迟行为(Behavior):`stabilizationWindowSeconds` 与 `policies` 控制扩缩速度与抖动实践示例apiVersion: autoscaling/v2

kind: HorizontalPodAutoscaler

metadata:

name: web-hpa

spec:

scaleTargetRef:

apiVersion: apps/v1

kind: Deployment

name: web

minReplicas: 2

maxReplicas: 20

metrics:

- type: Resource

resource:

name: cpu

target:

type: Utilization

averageUtilization: 70

behavior:

scaleUp:

stabilizationWindowSeconds: 30

policies:

- type: Percent

value: 100

periodSeconds: 60

scaleDown:

stabilizationWindowSeconds: 60

policies:

- type: Percent

value: 50

periodSeconds: 60

治理建议为指标采集与滞后设定缓冲时间;避免误触扩缩导致抖动将业务指标纳入伸缩决策(如排队长度、错误率)结语弹性伸缩是成本与体验的平衡艺术。以行为策略与多指标驱动,构建可预测的自动化扩缩容。

点赞(0) 打赏

评论列表 共有 0 条评论

暂无评论
立即
投稿

微信公众账号

微信扫一扫加关注

发表
评论
返回
顶部