Los pods del stack Loki se reinician con estado OOM.

davy.ai

August 6, 2023 at 5:57 am

Según la información proporcionada, parece que los pods se están reiniciando debido a errores de falta de memoria (OOM) a pesar de que se han establecido límites de memoria de 3Gi. Además, no hay información útil en los registros para entender por qué está sucediendo esto.

Una posible explicación podría ser que los pods están excediendo su límite de memoria, lo que hace que el OOM killer de Kubernetes los termine. Esto se puede confirmar al observar el consumo de recursos de los pods utilizando herramientas como kubectl top o los paneles de Prometheus/Grafana.

Otra posible razón podría ser una configuración incorrecta en la configuración del ingester para el stack de Loki, lo que provoca un uso excesivo de memoria. La configuración del ingester proporcionada no parece tener ningún problema obvio, pero podría valer la pena verificar otras configuraciones relacionadas, como el período de retención del almacenamiento y el número de índices utilizados.

Para investigar y resolver aún más el problema, sería útil recopilar más información, como el tamaño y el número de registros que se están ingestionando, el tamaño del nodo y cualquier cambio reciente que pueda haber afectado el sistema. También podría ser útil consultar con la comunidad de Loki para ver si existen problemas conocidos o mejores prácticas para optimizar el uso de recursos.

Answer

davy.ai

August 6, 2023 at 5:57 am

Según la información proporcionada, parece que los pods se están reiniciando debido a errores de falta de memoria (OOM) a pesar de que se han establecido límites de memoria de 3Gi. Además, no hay información útil en los registros para entender por qué está sucediendo esto.

Una posible explicación podría ser que los pods están excediendo su límite de memoria, lo que hace que el OOM killer de Kubernetes los termine. Esto se puede confirmar al observar el consumo de recursos de los pods utilizando herramientas como kubectl top o los paneles de Prometheus/Grafana.

Otra posible razón podría ser una configuración incorrecta en la configuración del ingester para el stack de Loki, lo que provoca un uso excesivo de memoria. La configuración del ingester proporcionada no parece tener ningún problema obvio, pero podría valer la pena verificar otras configuraciones relacionadas, como el período de retención del almacenamiento y el número de índices utilizados.

Para investigar y resolver aún más el problema, sería útil recopilar más información, como el tamaño y el número de registros que se están ingestionando, el tamaño del nodo y cualquier cambio reciente que pueda haber afectado el sistema. También podría ser útil consultar con la comunidad de Loki para ver si existen problemas conocidos o mejores prácticas para optimizar el uso de recursos.

Comments are closed.

es.davy.ai

¿Tienes una pregunta?

Los pods del stack Loki se reinician con estado OOM.

Answer

davy.ai