es.davy.ai

Preguntas y respuestas de programación confiables

¿Tienes una pregunta?

Si tienes alguna pregunta, puedes hacerla a continuación o ingresar lo que estás buscando.

Tag: GOOGLE-CLOUD-DATAFLOW

Enriquecer datos en tiempo real con Apache Beam y Datastore

Estoy trabajando con Google Dataflow (python) para intentar enriquecer los datos provenientes de Pub/Sub e insertarlos en BigQuery. Este es un diagrama de alto nivel de la solución: enlace He trabajado con Databrick y estoy intentando hacer algo similar, pero hasta ahora obtengo un rendimiento deficiente. Estoy usando una conexión . . . Read more

Diseño de Google Dataflow

Necesitamos tu orientación sobre el diseño del flujo de datos para el siguiente escenario. Requisito: Necesitamos construir un trabajo de flujo de datos para leer la base de datos MS SQL del flujo de datos y escribir en Bigquery. Necesitamos que el trabajo de flujo de datos tome como entrada . . . Read more

GCP Dataflow: utilizando Zonal SSD con zona desconocida

Actualmente establecemos la región para nuestros trabajos de Dataflow por lotes y en tiempo real, por ejemplo, “europe-west1”. Cuando usamos HDD, esto está bien. Pero ahora me gustaría probar los pipelines con SSD y, según las “opciones a nivel de trabajador” (worker-level-options) de Dataflow, puedo hacerlo, pero debo proporcionar la . . . Read more