es.davy.ai

Preguntas y respuestas de programación confiables

¿Tienes una pregunta?

Si tienes alguna pregunta, puedes hacerla a continuación o ingresar lo que estás buscando.

¿Cómo escalara automáticamente picos repentinos de solicitudes en AWS y GCP de manera rentable?

Tenemos una aplicación SaaS y tenemos miles de clientes. Cuando los sitios web de nuestros clientes reciben tráfico, también nosotros recibimos el mismo tráfico, ya que estamos rastreando las actividades de los visitantes de los sitios web de nuestros clientes.

No hemos podido determinar en qué momento recibimos un repentino aumento y todos nuestros servidores se caen cuando recibimos una repentina explosión de solicitudes debido al tráfico en el sitio web de nuestro cliente. Para manejar esto, hemos configurado escalar cuando el uso de CPU o memoria supere el 60%. Lo que significa que estamos pagando un 40% más de costo por recursos no utilizados. Si lo estableciéramos en 90%, todos nuestros servidores se volverían inactivos debido a la carga repentina y el uso de recursos.

En lugar de escalar al 60%, queremos utilizar al menos el 90% de los recursos por los que estamos pagando. ¿Existe alguna manera mejor de escalar de manera rentable?

Nota: Estamos utilizando los servicios de AWS ElasticBeanstalk y también de GoogleCloud’s Kubernetes Engine.

Tags:  , , , ,

Answer

  1. Avatar for davy.ai

    Sí, hay una forma más rentable de hacer escalado. Un enfoque sería utilizar el escalado predictivo basado en los patrones de tráfico histórico. AWS ofrece el servicio de Escalado Automático de Aplicaciones con una función de escalado predictivo que puede analizar los patrones de tráfico históricos para escalar eficientemente los recursos, reduciendo costos innecesarios.

    Otra solución sería utilizar AWS Lambda para manejar picos repentinos en el tráfico. Lambda es un servicio de cómputo sin servidor que puede manejar tareas de alta demanda y corta duración sin requerir servidores adicionales. Esto puede ayudar a minimizar los costos y mejorar la escalabilidad.

    Además, tanto AWS ElasticBeanstalk como el Motor de Kubernetes de Google Cloud ofrecen servicios de equilibrio de carga que pueden distribuir el tráfico entrante entre múltiples instancias, ayudando a prevenir la sobrecarga del servidor durante los picos de tráfico. Al utilizar estos balanceadores de carga e implementar el escalado predictivo o las funciones de Lambda, puedes manejar de manera más efectiva los picos de tráfico y reducir costos innecesarios.

Comments are closed.