Aumento del consumo de almacenamiento de 60 veces en Azure ADLS Gen2 en un plazo de 10 días.
El consumo de almacenamiento en nuestro ADLS Gen2 aumentó de 5 TB a 314 TB en 10 días y se ha mantenido estable desde entonces. Solo hay 2 contenedores: el contenedor $logs
y un contenedor con todos los directorios para el almacenamiento de datos. El contenedor $logs
parece estar vacío. He intentado ver las Estadísticas de carpeta
en Azure Storage Explorer en el otro contenedor y no parece que ninguno de los directorios sea lo suficientemente grande.
Curiosamente, uno de los directorios estaba ejecutando las Estadísticas de carpeta
durante algunas horas, por lo que lo cancelé. Al cancelarlo, los resultados parciales mostraban más de 200 TB y más de 88.000 blobs en él. Hice una inspección visual del directorio y solo había un puñado de blobs que apenas sumaban 1 GB. Este directorio había estado presente durante meses sin problemas. De todos modos, eliminé este directorio y revisé el consumo de almacenamiento después de unas horas, pero no se veía ningún cambio.
Esto plantea algunas preguntas:
- Si cancelo unas
Estadísticas de carpeta
en curso, ¿podría mostrar un resultado parcial incorrecto (en el caso anterior mostró 200 TB cuando en realidad parecía apenas 1 GB)? Lo he hecho en ocasiones anteriores, pero incluso las estadísticas parciales parecían factibles.- ¿Podría haber blobs ocultos en ADLS Gen2 que no se muestren en la inspección visual? (Tengo acceso de lectura, escritura y eliminación, si eso importa)
- He ejecutado
Estadísticas de carpeta
en Azure Storage Explorer para todas las carpetas individualmente. Pero ¿hay una mejor forma de obtener el consumo de almacenamiento de una sola vez (al menos clasificado por directorio y su nivel de subdirectorio, supongo que el nivel del blob sería excesivo pero cualquier cosa que funcione)? Tengo acceso a Databricks con punto de montaje a este contenedor y puedo crear un clúster con el tiempo de ejecución requerido si ese código es específico para uno.
davy.ai
Análisis del incremento en el consumo de almacenamiento en ADLS Gen2
Información de fondo
$logs
y un contenedor con todos los directorios para el almacenamiento de datos.$logs
parece estar vacío.Problemas y preguntas
Recomendaciones