Kafka: Usar múltiples consumidores para reducir el retraso del consumidor no funciona.

davy.ai

June 12, 2023 at 3:16 am

Observando el rendimiento de mensajes en el clúster Kafka

Como experto en TI especializado en Apache Kafka, Kafka-consumer-api, Kafka-python y Kafka-burrow, me he involucrado recientemente en la observación del rendimiento de mensajes de un clúster Kafka que consta de 3 brokers (instancias EC2) con un tema que tiene 100 particiones.

Para determinar la tasa de mensajes por segundo que puede manejar un número determinado de consumidores, envié mensajes a tasas variables, específicamente [20, 100, 500, 1000, 5000, 10000, 20000, 40000] por segundo. Para cada tasa de envío de mensajes, también utilicé [1, 10, 20, 30, …, 100] consumidores, con cada consumidor trabajando en una sola instancia EC2.

Para hacer esto posible, utilicé Kafka-python para crear productores y consumidores, y utilicé Burrow, Telegraf, InfluxDB y Grafana para monitorear el retraso de los consumidores por partición y el retraso total del consumidor. En particular, obtuve el retraso total del consumidor por partición y el retraso total del consumidor a través del punto final de Burrow /v3/kafka/live/consumer/{consumer-group}/status.

Los resultados se trazaron en Grafana y se mostró el patrón observado en la gráfica aquí:

Además, el retraso máximo del consumidor observado se representó gráficamente de la siguiente manera:

En general, este enfoque me permitió observar la cantidad de mensajes por segundo que un número determinado de consumidores puede manejar, proporcionando información sobre las capacidades de rendimiento del clúster Kafka en diferentes escenarios.

Answer

davy.ai

June 12, 2023 at 3:16 am

Observando el rendimiento de mensajes en el clúster Kafka

Como experto en TI especializado en Apache Kafka, Kafka-consumer-api, Kafka-python y Kafka-burrow, me he involucrado recientemente en la observación del rendimiento de mensajes de un clúster Kafka que consta de 3 brokers (instancias EC2) con un tema que tiene 100 particiones.

Para determinar la tasa de mensajes por segundo que puede manejar un número determinado de consumidores, envié mensajes a tasas variables, específicamente [20, 100, 500, 1000, 5000, 10000, 20000, 40000] por segundo. Para cada tasa de envío de mensajes, también utilicé [1, 10, 20, 30, …, 100] consumidores, con cada consumidor trabajando en una sola instancia EC2.

Para hacer esto posible, utilicé Kafka-python para crear productores y consumidores, y utilicé Burrow, Telegraf, InfluxDB y Grafana para monitorear el retraso de los consumidores por partición y el retraso total del consumidor. En particular, obtuve el retraso total del consumidor por partición y el retraso total del consumidor a través del punto final de Burrow /v3/kafka/live/consumer/{consumer-group}/status.

Los resultados se trazaron en Grafana y se mostró el patrón observado en la gráfica aquí:

Además, el retraso máximo del consumidor observado se representó gráficamente de la siguiente manera:

En general, este enfoque me permitió observar la cantidad de mensajes por segundo que un número determinado de consumidores puede manejar, proporcionando información sobre las capacidades de rendimiento del clúster Kafka en diferentes escenarios.

Comments are closed.

es.davy.ai

¿Tienes una pregunta?

Kafka: Usar múltiples consumidores para reducir el retraso del consumidor no funciona.

Answer

davy.ai