es.davy.ai

Preguntas y respuestas de programación confiables

¿Tienes una pregunta?

Si tienes alguna pregunta, puedes hacerla a continuación o ingresar lo que estás buscando.

Tag: SPARK-STREAMING-KAFKA

Cómo guardar o imprimir los datos de receiverStream en Spark Scala.

Estoy usando el receptor personalizado a continuación para consumir datos de Rabbitmq en Spark-Scala. import org.apache.spark.streaming.rabbitmq.RabbitMQUtils import java.io.{BufferedReader, InputStreamReader} import java.net.Socket import java.nio.charset.StandardCharsets import org.apache.spark.SparkConf import org.apache.spark.rdd.RDD import org.apache.spark.storage.StorageLevel import org.apache.spark.streaming.{Seconds, StreamingContext} import org.apache.spark.streaming.dstream.{InputDStream, ReceiverInputDStream} import org.apache.spark.SparkContext import org.apache.spark.streaming._ import org.apache.spark.streaming.receiver._ import org.apache.spark.internal.Logging import org.apache.spark._ import org.apache.spark.streaming._ import org.apache.spark.internal.Logging import . . . Read more

Writestreaming no está escribiendo datos en la tabla en Databricks.

¿Alguien puede ayudarme con este problema? Tengo una tabla delta “orders”. Esta tabla se carga con 1000 registros utilizando el archivo delta. Ahora estamos recibiendo un archivo JSON en tiempo real que está añadiendo datos a esta tabla. Dataframe de lectura de transmisión orderInputDF: from pyspark.sql.functions import * orderInputDF = . . . Read more

WriteStream con el formato (‘console’) en Azure Synapse Notebook

Tengo un flujo de datos que puedo escribir en una tabla en memoria con pyspark y consultarla con sql desde allí: transformeddata.writeStream\ .format("memory")\ .queryName("transformeddatatable")\ .trigger(processingTime='5 seconds')\ .start()\ .awaitTermination(20) # escribir los datos durante 20 segundos en la tabla en memoria desde el flujo En la siguiente celda puedo consultar los . . . Read more

Agregue los valores de una columna a otra columna JSON en el mismo dataframe.

Tengo algunos datos en un dataframe que se ve así: +———–+——–+———–+——————————–+ | Noun | Pronoun| Adjective | Metadata | +———–+——–+———–+——————————–+ | Homer | Simpson| Engineer | {“Age”: “50”, “Country”: “USA”} | | Elon | Musk | King | {“Age”: “45”, “Country”: “RSA”} | | Bart | Lee | Cricketer | . . . Read more