Tag: CHOETL
Tengo una tarea entre manos, donde se supone que debo crear un conector de API HTTP basado en Python para Airbyte. El conector devolverá una respuesta que contendrá algunos enlaces de archivos zip. Cada archivo zip contiene un archivo CSV que se supone que debe cargarse en BigQuery. Ahora he . . . Read more
Soy nuevo en Talend y quiero encontrar la diferencia entre las dos marcas de tiempo. Tengo dos columnas start_time y end_time. Quiero crear una tabla en el destino que muestre la diferencia entre ambas marcas de tiempo, específicamente quiero mostrar horas, minutos y segundos. Además, quiero que la hora sea . . . Read more
Digamos que tienes que enriquecer un evento con una columna de ID mayormente estática, pero la mitad de los datos correspondientes no existen en el almacén local de tus procesadores de flujo, pero sí en tu base de datos. ¿Cómo resolverías este problema? Si busco los datos faltantes en la . . . Read more
Tengo alrededor de 5 tablas bastante grandes de 100 millones de registros cada una, las cuales cambian significativamente cada día y necesitan ser accedidas para generar informes detallados a través de nuestras APIs. Actualmente, cargo los datos a un esquema stg desde nuestro almacén de datos, luego utilizo funciones para . . . Read more
Estamos realizando pruebas de carga inicial y pruebas de carga incremental en las tablas objetivo del almacén de datos. Entonces, ¿validamos los valores de campo de auditoría en la prueba de carga inicial o validamos los valores de campos de auditoría en las pruebas de carga incremental? Como parte de . . . Read more