es.davy.ai

Preguntas y respuestas de programación confiables

¿Tienes una pregunta?

Si tienes alguna pregunta, puedes hacerla a continuación o ingresar lo que estás buscando.

Tag: APACHE-SPARK

Transmisión estructurada de Spark desde Kafka hacia Elastic Search.

Quiero escribir un trabajo de Spark Streaming desde Kafka hasta Elasticsearch. Aquí quiero detectar el esquema de forma dinámica mientras lo leo desde Kafka. ¿Me puedes ayudar a hacer eso? Sé que esto se puede hacer en Spark Batch Processing a través de la siguiente línea. val schema = spark.read.json(dfKafkaPayload.select("value").as[String]).schema . . . Read more

but got null/null. EsHadoopIllegalArgumentException: No se encontró ningún tipo; Los tipos son requeridos al escribir en versiones de ES 6 o inferiores. Se esperaba [índice]/[tipo], pero se obtuvo null/null.

Hola, estoy usando la versión 6.6.1 de ES. Mientras Spark escribe los datos en ES, arroja la siguiente excepción: “org.elasticsearch.hadoop.EsHadoopIllegalArgumentException: No se encontró ningún tipo; se requieren tipos al escribir en las versiones 6 y anteriores de ES. Se esperaba [index]/[type], pero se obtuvo [minombredeíndice]”. ¿Alguien puede ayudarme a resolver . . . Read more

PySpark: Iterar sobre una lista de dataframes

Tengo un par de dataframes y quiero que todas sus columnas estén en mayúsculas. Hice esto de la siguiente manera: for col in df1.columns: df1 = df1.withColumnRenamed(col, col.upper()) for col in df2.columns: df2 = df2.withColumnRenamed(col, col.upper()) Ahora quiero hacer esto en una iteración de array como esta: lista = (df1, . . . Read more