es.davy.ai

Preguntas y respuestas de programación confiables

¿Tienes una pregunta?

Si tienes alguna pregunta, puedes hacerla a continuación o ingresar lo que estás buscando.

Tag: AZURE-DATABRICKS

Ejecute python_wheel_task utilizando la API de envío de Databricks.

Quería ejecutar la rueda de Python como un trabajo de Spark utilizando el punto de conexión de la API “api/2.0/jobs/runs/submit”, proporcionando el nombre del paquete y el punto de entrada: { ‘existing_cluster_id’: self.cluster_id, “python_wheel_task”: { “package_name”: “my.package”, “entry_point”: “my_method” }, “libraries”: [ {“whl”: “dbfs:/FileStore/jars/1e023c35_ca3a_42c0_958b_fa308124ccc3/my_lib-0.0.1-py3-none-any.whl”} ] } Sin embargo, cuando la . . . Read more

org.apache.spark.SparkException: Escritura de trabajo cancelada en Databricks

He utilizado Databricks para capturar datos de Event Hub y procesarlos en tiempo real con Pyspark Streaming. El código funciona bien, pero después de esta línea: df.writeStream.trigger(processingTime='100 seconds').queryName("myquery")\ .format("console").outputMode('complete').start() Estoy obteniendo el siguiente error: org.apache.spark.SparkException: Trabajo de escritura abortado. Causado por: java.io.InvalidClassException: org.apache.spark.eventhubs.rdd.EventHubsRDD; clase local incompatible: clase flujo streamdesc He . . . Read more