Horizontal Pod Autoscaler integration¶

The Horizontal Pod Autoscaler (HPA) is a Kubernetes feature that automatically scales the number of pods in a replication controller, deployment, or replica set based on observed CPU utilization or memory usage^[400-devops-06-kubernetes-devops-helm-terraform-helm-helm-charts-metrics-server-readme.md].

To function correctly, the HPA requires access to resource usage data. This data is typically provided by the Metrics Server, a cluster-wide aggregator of resource usage data^[400-devops-06-kubernetes-devops-helm-terraform-helm-helm-charts-metrics-server-readme.md]. Consequently, system administrators must ensure that Metrics Server is deployed and configured within the cluster to enable autoscaling capabilities^[400-devops-06-kubernetes-devops-helm-terraform-helm-helm-charts-metrics-server-readme.md].

While the default HPA configuration utilizes standard resource Metrics, the system can also be configured to scale based on custom Metrics. For custom metric autoscaling, integration with a Prometheus Adapter is required^[400-devops-06-kubernetes-devops-helm-terraform-helm-helm-charts-metrics-server-readme.md].

Sources¶

^[400-devops-06-kubernetes-devops-helm-terraform-helm-helm-charts-metrics-server-readme.md]