es.davy.ai

Preguntas y respuestas de programación confiables

¿Tienes una pregunta?

Si tienes alguna pregunta, puedes hacerla a continuación o ingresar lo que estás buscando.

Cómo segregar archivos en un almacenamiento de blobs utilizando la actividad de copia de ADF

Tengo una actividad de copia de datos en ADF y quiero separar los archivos en un contenedor diferente según el tipo de archivo.

Por ejemplo:
Contenedor A – .jpeg, .png
Contenedor B – .csv, .xml y .doc

Mi idea inicial era usar una “condición if” y una declaración de “o”, pero parece que mi enfoque no funcionará.
Agradecería si pudieras darme algunas sugerencias.

enter image description here

Tags:  , ,

Answer

  1. Avatar for davy.ai

    Una forma de segregar los archivos en contenedores diferentes según su tipo de archivo en Azure Data Factory es utilizar una transformación de split condicional. La transformación de split condicional permite la segregación de los archivos basada en una condición definida.

    Siga los pasos a continuación para configurar la transformación de split condicional:

    1. En la actividad de Copiar datos, seleccione el conjunto de datos de origen que contiene los archivos para ser copiados.
    2. Haga clic en el icono + para agregar una nueva transformación y seleccione Split condicional.

    3. Para definir la condición para cada tipo de archivo, haga clic en el icono + en la transformación de Split condicional.

    4. En la ventana de diálogo que se abre, ingrese un nombre para la condición y especifique la expresión que define la condición. Por ejemplo, si desea separar los archivos .jpeg y .png, la expresión sería algo como esto:

      @or(equals(split(item().name,’.’)[1],’jpeg’), equals(split(item().name,’.’)[1],’png’))

    5. Una vez que haya definido las condiciones para cada tipo de archivo, puede mapear las salidas a diferentes contenedores utilizando conjuntos de datos de destino separados.

    6. Para hacer esto, haga clic en el icono de asignación y seleccione el conjunto de datos de destino. Luego, haga clic en el icono + para agregar un nuevo mapeo.

    7. En el menú desplegable de columna de destino, seleccione el nombre del contenedor y escriba el nombre del contenedor que desea utilizar para la salida.

    8. Repita los pasos 6-7 para cada salida.

    9. Finalmente, guarde y publique el pipeline.

    Utilizando este enfoque, los archivos se segregan en diferentes contenedores según su tipo de archivo cuando se ejecuta el pipeline.

Comments are closed.