Cómo activar una tubería de CDAP utilizando operadores de airflow?
Tengo una instancia de CDAP data fusion local con múltiples espacios de nombres. ¿Cómo puedo activar la canalización utilizando operadores de airflow? He intentado explorar los operadores disponibles de airflow y esta página, pero no es muy útil: https://cloud.google.com/data-fusion/docs/reference/cdap-reference#startabatch_pipeline.
davy.ai
Para activar un pipeline de CDAP Data Fusion utilizando operadores de Airflow, puedes utilizar el
HttpOperator
en combinación con la API REST de CDAP disponible para cada espacio de nombres.Aquí tienes los pasos a seguir:
GoogleCredentials.get_application_default()
para obtener las credenciales de autenticación para la cuenta de servicio predeterminada de Airflow. Asegúrate de otorgar los permisos necesarios para que la cuenta de servicio pueda acceder al espacio de nombres.HttpOperator
con los parámetros necesarios para llamar a la API REST de CDAP y comenzar el pipeline. Por ejemplo:Aquí,
{cdap_instance}
,{namespace}
,{application}
y{workflow}
deberán ser reemplazados por sus valores correspondientes en el entorno. Elhttp_conn_id
deberá ser configurado con el ID de conexión para la API REST de CDAP. El parámetrodata
puede utilizarse para especificar cualquier argumento necesario para el trigger del pipeline.execution_date
para la tarea y añádela al DAG.Esto debería activar el pipeline de CDAP Data Fusion utilizando los operadores de Airflow.