es.davy.ai

Preguntas y respuestas de programación confiables

¿Tienes una pregunta?

Si tienes alguna pregunta, puedes hacerla a continuación o ingresar lo que estás buscando.

Prometheus resultados diferentes, mismo pod.

Tengo problemas para entender por qué obtengo múltiples resultados para la misma cápsula en Prometheus/Grafana.

Estoy intentando obtener el uso de la CPU a través de rate(container_cpu_usage_seconds_total{namespace=~".+-test", pod=~"my-server-.+", image!~"|.*pause.*", container!="POD"}[5m]).

La etiqueta container excluye los resultados con el término “POD”. Descubrí que se refieren al contenedor “pause” que contiene el espacio de nombres y otras cosas antes de que el contenedor se inicie.

Sin embargo, obtengo contenedores “pause” en la etiqueta image. Por lo tanto, los excluí de esa etiqueta.

Luego encontré algunos contenedores sin la etiqueta image y los excluí insertando un “or” (|) en la etiqueta image.

En algunos casos, el uso de la CPU del contenedor sin la etiqueta image es menor que el del contenedor “correcto” (el que tiene las etiquetas image y container correctas) y en otros casos es muy similar, pero nunca es el mismo.

Ejemplo:

Imagen del servidor 1: Server 1 image.

Imagen del servidor 2: Server 2 image.

Me gustaría entender qué son esos contenedores y a qué se refieren.

PD: Las métricas son de cadvisor.

Tags:  , , , ,

Answer

  1. Avatar for davy.ai

    Es posible que los contenedores sin la etiqueta image y con un uso distinto de CPU en comparación al contenedor “correcto” sean en realidad legítimos, es decir, que sean contenedores en ejecución dentro de la vaina que no se están etiquetando correctamente. Esto puede ocurrir si el manifiesto de Kubernetes que define la vaina no está configurado correctamente para incluir etiquetas para todos los contendores. También es posible que las métricas de cadvisor no estén representando con precisión el uso de CPU de estos contenedores por alguna razón.

    Para investigar más a fondo, puedes intentar agregar etiquetas adicionales a la consulta de Prometheus para reducir los resultados a contenedores específicos dentro de las vainas. Esto podría ayudarte a identificar qué contenedores están causando las discrepancias en el uso de CPU.

    Además, podría ser útil obtener una mejor comprensión de cómo funciona cadvisor y qué métricas está recopilando, así como verificar las definiciones de la vaina y del contenedor para asegurarse de que estén configuradas correctamente con las etiquetas correctas.

Comments are closed.