使用 KEDA 实现 Kubernetes 自动弹性伸缩 ¶

什么是 Kubernetes Autoscaling ？

Kubernetes Autoscaling 是 Kubernetes 容器编排系统中的一项动态功能，可以根据工作负载需求自动调整计算资源。这一功能通过平衡和优化资源分配，既能维持应用程序的性能，又能避免财务浪费。通过增加资源来处理流量激增，确保最佳性能，并在空闲期间部署较少的资源以节省成本。

Kubernetes Autoscaling 的好处包括最大限度地提高资源利用率、提供成本效益以及保证应用程序的持续可用性。任何使用 Kubernetes 的组织都可以从 Autoscaling 中获益，尤其是当应用程序在繁忙和空闲时期之间切换时。

Autoscaling 的关键优势之一是提供了弹性和敏捷性，可以根据实际需求动态调整资源。当负载增加时，Autoscaling 能够快速响应并自动扩展应用程序的副本数量，以满足当前的需求。这种扩展能力可确保应用程序具备足够的资源来处理高负载情况，从而避免性能瓶颈和用户体验下降。相反，在负载减少时，Autoscaling 可以自动缩减应用程序的副本数量，以节省成本并提高资源利用率。

此外，Autoscaling 还带来了更好的成本效益。通过根据实际需求调整资源配置，可以避免不必要的资源浪费。在高峰期间，通过增加资源来满足需求，可以确保最佳性能，但在空闲期间，可以减少资源并节省资金。这种动态的资源管理策略能够实现资源的最佳利用，提高成本效益。

Kubernetes 原生 H/VPA Autoscaling 存在的弊端‍‍

虽然 Kubernetes 的 HPA（Horizontal Pod Autoscaler）和 VPA（Vertical Pod Autoscaler）提供了 Autoscaling 能力，但它们也存在一些潜在的瓶颈和限制，具体如下所示：

延迟和响应时间

HPA 和 VPA 的 Autoscaling 过程需要一定的时间来监测指标并作出调整，从而可能会导致在负载突然增加或减少时出现一定的延迟，无法立即响应变化。这种延迟可能会导致性能下降或资源浪费。
指标选择和配置

同时，HPA 和 VPA 的 Autoscaling 依赖于指标的选择和配置。选择不合适的指标或错误地配置指标阈值可能导致扩缩容的不准确性。因此，正确选择和配置指标是确保 Autoscaler 有效运行的重要因素。
基础设施强绑

HPA 和 VPA 依赖于底层基础设施的可扩展性和弹性。如果底层基础设施无法满足自动扩缩容的需求，例如，底层节点资源有限或网络带宽不足，那么自动弹性伸缩的效果将受到限制。
应用程序设计限制

在实际的业务场景中，往往存在某些应用程序可能不适合自动扩缩容，特别是具有持久性状态或特定调度要求的应用程序。这些应用程序可能需要采取额外的措施来处理自动扩缩容引起的状态管理或数据持久性问题。
实施的复杂性

通常而言，为 H/VPA 创建自定义指标可能并非易事。这个过程需要对 Kubernetes 内部结构有一定的了解，并需要开发人员深入研究相关接口和进行复杂的代码修改。因此，对于没有相关经验的开发人员来说，这可能是一个具有挑战性的任务。从长远角度来看，这种额外的复杂性可能会导致维护困难。