es.davy.ai

Preguntas y respuestas de programación confiables

¿Tienes una pregunta?

Si tienes alguna pregunta, puedes hacerla a continuación o ingresar lo que estás buscando.

Tag: GOOGLE-CLOUD-DATAPROC

Creando un clúster de Dataproc con múltiples JARs.

Estoy intentando crear un clúster dataproc que conectará dataproc a Pub/Sub. Necesito agregar varios archivos .jar en la creación del clúster en la bandera spark.jars. gcloud dataproc clusters create cluster-2c76 –region us-central1 –zone us-central1-f –master-machine-type n1-standard-4 \ –master-boot-disk-size 500 \ –num-workers 2 \ –worker-machine-type n1-standard-4 \ –worker-boot-disk-size 500 \ –image-version . . . Read more

Cómo agregar el conector de bigquery a un clúster existente en dataproc.

Acabo de empezar a usar dataproc para hacer aprendizaje automático en big data en bigquery. Cuando intento ejecutar este código: df = spark.read.format(‘bigquery’).load(‘bigquery-public-data.samples.shakespeare’) Recibo un error con una parte como esta: java.lang.ClassNotFoundException: Error al encontrar el origen de datos: bigquery. Encuentra los paquetes en http://spark.apache.org/third-party-projects.html Encontré algunos tutoriales como en . . . Read more