Tag: GOOGLE-MANAGED-PROMETHEUS
Tenemos una aplicación en ejecución en Kubernetes (AWS EKS) y podemos iniciar sesión en el host bastión y obtener los registros de los PODS. Actualmente, nuestra aplicación está teniendo problemas y nos gustaría depurar los registros de la aplicación por problemas de manera horaria. Somos capaces de obtener los registros . . . Read more
Tengo dos métricas que quiero mostrar en el panel de series temporales: histogram_quantile( 0.95, tasa(corrección_ms_bucket[1m]) ) histogram_quantile( 0.95, tasa(request_time_bucket[1m]) ) El problema es que mi panel tiene la unidad Tiempo/milisegundos, pero la métrica request_time_bucket es en segundos (no puedo cambiar la métrica en sí porque ya hay algo que depende . . . Read more
Lo que pretendo encontrar es el promedio de la latencia p99 en los últimos t minutos. Intenté esta consulta, pero regresó con el error “solo se permiten rangos para selectores de vectores” avg_over_time(histogram_quantile(0.99, sum(rate(latency_buckets{service=”foo”}[5m])) by (le))[5m]) Por lo que entiendo, lo que hace histogram_quantile es devolver un valor instantáneo (digamos . . . Read more
¿Existe alguna forma de acceder a la instancia actual mientras se agrupa por instancia? Lo que estoy tratando de hacer es obtener kubenodestatuscapacitycpu_cores mientras se agrupa por instancia. Actualmente estoy codificando manualmente la cantidad de núcleos de CPU, pero quiero parametrizarlo, ya que las nodos pueden tener diferentes cantidades de . . . Read more
Estamos tratando de disminuir la latencia de nuestro servicio de predicción de modelos BERT que se implementa utilizando FastAPI. Las predicciones se llaman a través del punto final /predict. Examimos el seguimiento y encontramos que uno de los cuellos de botella es el prometheus-fastapi-instrumentator. Alrededor del 1% de las solicitudes . . . Read more