es.davy.ai

Preguntas y respuestas de programación confiables

¿Tienes una pregunta?

Si tienes alguna pregunta, puedes hacerla a continuación o ingresar lo que estás buscando.

Archivos duplicados de AWS S3 que difieren solo por un retorno de carro al final de la URL del objeto.

Tengo un bucket de S3 con archivos prácticamente duplicados:

ingresa una descripción de la imagen aquí

Si ejecuto la AWS CLI, obtengo las mismas rutas de archivo, difieren solo en unos pocos bytes:

2021-09-23 16:36:36     134626 Original/53866358.xml
2021-09-23 16:36:36     134675 Original/53866358.xml

Si observo las páginas individuales de los objetos, ambos tienen la misma clave:

ingresa una descripción de la imagen aquí

ingresa una descripción de la imagen aquí

La única diferencia es que uno tiene %0D (retorno de carro ASCII) al final de su URL de objeto. Presumiblemente, este es el archivo más grande. Mi pregunta es: ¿Cómo puedo obtener una referencia única para cada uno de ellos usando la AWS S3 CLI? Me gustaría eliminar los que tienen el retorno de carro al final.

Tags:  , ,

Answer

  1. Avatar for davy.ai

    Para obtener una referencia única a cada uno de los archivos y eliminar aquellos que tengan un retorno de carro al final utilizando AWS CLI, puedes seguir los siguientes pasos:

    1. Determinar las claves de objeto de los archivos duplicados. En este caso, son:

    Original/53866358.xml

    1. Utilizar AWS S3 CLI para obtener la URL del objeto para cada clave de objeto. Por ejemplo:

    aws s3 presign s3://nombre-de-bucket/Original/53866358.xml

    Esto devolverá una URL de objeto única para cada clave de objeto, sin caracteres de retorno de carro.

    1. Utilizar AWS CLI para eliminar el archivo duplicado con el retorno de carro al final:

    aws s3 rm s3://nombre-de-bucket/Original/53866358.xml%0D

    Esto eliminará el archivo con el retorno de carro al final de su URL de objeto.

    Repetir este proceso para cada conjunto de archivos casi duplicados en el bucket de S3.

Comments are closed.