Tag: APACHE-ZEPPELIN

Importar biblioteca externa de Python desde S3 en Zeppelin.

02 Aug, 2023 Programación 0

Desarrollé una biblioteca personalizada de Python que coloqué en un cubo de S3, y ahora quiero usar Zeppelin con el intérprete de pyspark para interactuar con ella. Sin embargo, no puedo encontrar una forma de hacerlo. ¿Alguien sabe cómo hacerlo? Cosas que he intentado: En Glue es posible incluir una . . . Read more

Cómo cambiar las configuraciones de Apache Zeppelin en el clúster EMR EC2 para mostrar los paquetes de Helium?

27 Jul, 2023 Programación 0

No estoy seguro de cómo cambiar las configuraciones de Apache Zeppelin en un clúster EMR. La idea es cambiar el valor de zeppelin.helium.registry a helium,https://s3.amazonaws.com/helium-package/helium.json para que Helium funcione (https://zeppelin.apache.org/docs/0.9.0/development/helium/overview.html). Uso la versión 0.10.0 de Zeppelin y Helium se ve así: aquí. ¿Cómo puedo cambiar las configuraciones de Zeppelin para . . . Read more

El orden de las columnas en Apache Zeppelin al seleccionar los datos de la tabla temporal está incorrecto, ¿cómo colocar una columna específica primero?

27 Jul, 2023 Programación 0

Actualmente tenemos la salida del scala DataFrame con el valor de id mostrado primero (pero se agrega cronológicamente al DataFrame en último lugar). Otras columnas aparecen dinámicamente en función de la función .pivot() y los datos. Cuando solicito los datos en el intérprete %sql, el orden cambia, lo que hace . . . Read more

Zeppelin con BigQuery resulta en “¡La ejecución de SQL ha devuelto un error!”

22 Jul, 2023 Programación 0

Instalé y configuré Zeppelin según lo indica el documento. Establecí GOOGLE_APPLICATION_CREDENTIALS como variable de entorno en conf/zeppelin-env.sh export GOOGLE_APPLICATION_CREDENTIALS=/home/anderson/.ssh/gcp-credentials.json Configuré el intérprete de BigQuery estableciendo zeppelin.bigquery.project_id. Después de estas configuraciones, pude ejecutar la siguiente consulta SQL de BigQuery para un conjunto de datos público sin ningún problema. %bigquery <h1>standardSQL</h1> SELECT . . . Read more

Cómo obtener DataFrame de la tabla de la base de datos recuperada con JDBC, cortada por múltiples rangos de fechas, con un rango de fecha por fila en otro DataFrame.