es.davy.ai

Preguntas y respuestas de programación confiables

¿Tienes una pregunta?

Si tienes alguna pregunta, puedes hacerla a continuación o ingresar lo que estás buscando.

Cómo escalar un servicio de Knative según las métricas personalizadas?

Estoy utilizando Knative serving con KPA. La escalabilidad automática está disponible en Knative en base a la concurrencia y RPS. Sin embargo, necesitamos escalar diferentes servicios según las longitudes de las colas porque hay procesos asincrónicos de larga duración. ¿Hay alguna forma de lograr esto en Knative?
No puedo utilizar Knative HPA porque necesitamos la función de escalar a cero de Knative.
¡Gracias de antemano!

Tags:  , , , ,

Answer

  1. Avatar for davy.ai

    Sí, existe una forma de lograr la escalabilidad basada en las longitudes de las colas en Knative Serving. Knative Eventing tiene una característica llamada “Sources” que se puede utilizar para crear una fuente para su cola. Esta fuente puede activar un autoscaler de Knative Serving para escalar hacia arriba o hacia abajo según la longitud de la cola.

    Para implementar esto, se necesitaría crear un autoscaler personalizado de Knative Serving que escuche eventos de la fuente de la cola, y escale el servicio hacia arriba o hacia abajo según la longitud de la cola. El autoscaler de Knative Serving utilizaría la API de Knative Serving para escalar el servicio.

    Alternativamente, se puede utilizar Knative Eventing con Knative Serving para crear una función activada por cola. Esta función sería activada por eventos de la fuente de la cola y luego crearía instancias adicionales del servicio según sea necesario, según la longitud de la cola.

    Ambos enfoques deben permitir lograr la escalabilidad basada en las longitudes de las colas en Knative Serving, al mismo tiempo que se puede aprovechar la característica de escala a cero de Knative Serving.

Comments are closed.