es.davy.ai

Preguntas y respuestas de programación confiables

¿Tienes una pregunta?

Si tienes alguna pregunta, puedes hacerla a continuación o ingresar lo que estás buscando.

EKS – Balanceadores de carga pendientes – No hay eventos

Tengo un clúster en EKS, en el que se crean y destruyen constantemente entornos utilizando helm, cada uno bajo su propio espacio de nombres y cada uno creando su propio balanceador de carga usando “ingress-nginx“.

Hoy, de repente, los balanceadores de carga para los nuevos entornos dejaron de crearse y quedaron bloqueados en “Pendiente” (uno de ellos ha estado pendiente durante más de 70 minutos). Además, no hay eventos disponibles para esos servicios, por lo que no hay ninguna pista sobre cuál podría ser el problema.

También intenté ejecutar kubectl cluster-info dump | grep LoadBalancer pero no obtuve resultados.

¿Alguna pista sobre cuál podría ser el problema? ¿O alguna pista de depuración?

Editar:
Después de ~90 minutos de interrupción, de repente se crearon todos los balanceadores de carga y comenzaron a funcionar. ¿Tal vez una interrupción de AWS? No encontré nada en su sitio web de comprobación de salud.

Tags:  , ,

Answer

  1. Avatar for davy.ai

    Posibles razones por las cuales los balanceadores de carga creados usando ingress-nginx se quedan en estado Pendiente y algunas pistas de depuración son:

    1. Recursos insuficientes: Verificar si hay suficientes recursos en el clúster de EKS para crear balanceadores de carga adicionales. La insuficiencia de CPU, memoria o direcciones IP puede provocar que los servicios se queden en estado Pendiente.
    2. Problemas de red: Asegurarse de que la VPC y las subredes utilizadas por el clúster de EKS puedan admitir los balanceadores de carga adicionales. Verificar que los grupos de seguridad, ACL de red y tablas de enrutamiento estén configurados correctamente.

    3. Configuración de ingress: Verificar la configuración del controlador de ingress y los recursos de ingress para garantizar que sean correctos. Una anotación faltante o incorrecta en el recurso de ingress puede provocar que el controlador de ingress ignore el recurso.

    4. Configuración de Helm chart: Verificar que la configuración del chart de Helm para el entorno sea correcta. Verificar si la versión del chart o los valores han cambiado, provocando que el entorno no esté disponible.

    5. Problemas de AWS: Verificar la página de estado del servicio de AWS para cualquier problema en curso con los servicios EKS o ELB.

    Pistas de depuración:

    1. Verificar los registros del controlador de ingress y el pod que ejecuta el servicio para obtener más información sobre lo que está sucediendo.

    2. Utilizar el comando describe para obtener más detalles sobre el servicio y los pods que se ejecutan en el entorno.

    3. Utilizar el comando get events para verificar si hay eventos relacionados con los servicios pendientes.

    4. Utilizar el comando get pods -o wide para verificar el nodo y la dirección IP asignada al pod y compararla con los recursos disponibles en el clúster.

    5. Intentar eliminar los servicios atascados y volver a implementarlos usando Helm para ver si el problema persiste.

Comments are closed.