El nodo del Clúster Galera de MariaDB accede mucho al disco, lo que lleva a una degradación masiva del rendimiento.

Tenemos un clúster de galera de mariadb de tres nodos, 3 máquinas virtuales de Ubuntu 20 en diferentes servidores físicos, y un nodo solo puede procesar aproximadamente la mitad de las consultas, pero tiene al menos tres veces la carga de CPU que cada uno de los otros dos nodos. Los tres nodos se ejecutan en hardware similar, tienen una configuración idéntica (verifiqué las configuraciones de mariadb y todas las variables del servidor), y los parámetros de VM son idénticos. Después de mucha búsqueda, reduje el problema a acceso a disco que solo ocurre en el nodo degradado. En los otros nodos, no veo ninguno de estos. Usando iotop, veo lo siguiente:

EDITAR: He identificado una consulta de larga duración en el nodo degradado. Sin embargo, la misma consulta es muy rápida en los otros dos nodos. ¿Cómo es posible? La caché de consulta está completamente deshabilitada.

¿Cómo puedo reducir esto aún más? ¿Cuál podría ser el problema?

davy.ai

June 16, 2023 at 10:28 am

Basándose en la información proporcionada, parece probable que el problema esté relacionado con el acceso al disco. El hecho de que solo un nodo esté experimentando este problema sugiere que puede haber un problema con el disco en ese nodo en particular.

Para reducir el problema aún más, podrías intentar ejecutar pruebas de rendimiento del disco en cada nodo para ver si hay alguna discrepancia en el rendimiento. También podrías intentar intercambiar discos entre nodos para ver si el problema sigue al disco o se queda en el nodo.

Si has identificado una consulta de larga duración en el nodo degradado, podrías intentar ejecutar esa misma consulta en los otros dos nodos para ver si también es lenta. Si es rápida en los otros dos nodos, entonces puede haber otros factores en juego, como diferencias en la distribución de datos o indexación.

En cualquier caso, puede valer la pena monitorear el uso del disco en todos los nodos para ver si hay algún patrón o pico inusual que pueda indicar un problema. Además, revisar los registros de consulta lenta en todos los nodos puede proporcionar una mayor comprensión de la causa raíz del problema.

Answer

davy.ai

June 16, 2023 at 10:28 am

Basándose en la información proporcionada, parece probable que el problema esté relacionado con el acceso al disco. El hecho de que solo un nodo esté experimentando este problema sugiere que puede haber un problema con el disco en ese nodo en particular.

Para reducir el problema aún más, podrías intentar ejecutar pruebas de rendimiento del disco en cada nodo para ver si hay alguna discrepancia en el rendimiento. También podrías intentar intercambiar discos entre nodos para ver si el problema sigue al disco o se queda en el nodo.

Si has identificado una consulta de larga duración en el nodo degradado, podrías intentar ejecutar esa misma consulta en los otros dos nodos para ver si también es lenta. Si es rápida en los otros dos nodos, entonces puede haber otros factores en juego, como diferencias en la distribución de datos o indexación.

En cualquier caso, puede valer la pena monitorear el uso del disco en todos los nodos para ver si hay algún patrón o pico inusual que pueda indicar un problema. Además, revisar los registros de consulta lenta en todos los nodos puede proporcionar una mayor comprensión de la causa raíz del problema.

Comments are closed.

es.davy.ai

¿Tienes una pregunta?

El nodo del Clúster Galera de MariaDB accede mucho al disco, lo que lleva a una degradación masiva del rendimiento.

Answer

davy.ai