Tag: ELASTICSEARCH-HADOOP
Tengo un archivo sample.hql que contiene las siguientes líneas: desc db.table1; desc db.table2; desc db.table3; Estoy tratando de ejecutarlo desde el comando de la terminal. Quiero saber si una columna en particular está presente en la tabla o no. Por ejemplo, si col1 está presente en table1, el resultado debería . . . Read more
He creado algunas tablas en mi clúster de Hadoop y tengo algunas tablas de parquet con datos para insertar. ¿Cómo puedo hacer esto? Quiero enfatizar que ya tengo tablas vacías creadas con comandos DDL y también se almacenan como parquet, por lo que no tengo que crear tablas, solo importar . . . Read more
Cómo puedo instalar Apache Oozie en Windows 10, sin usar una máquina virtual? No pude encontrar ningún documento. Gracias.
Pyspark tiene una función llamada sequenceFile que nos permite leer un archivo de secuencia que está almacenado en HDFS o en alguna ruta local disponible para todos los nodos. Sin embargo, ¿qué pasa si ya tengo un objeto de bytes en la memoria del controlador que necesito deserializar y escribir . . . Read more
Tenemos un clúster en Cloudera. Estamos utilizando instantáneas para respaldar el HDFS. Recientemente, hemos observado que el espacio utilizado en HDFS ha estado creciendo significativamente. Sospechamos que esto se debe a las instantáneas que utilizamos para las copias de seguridad. Cuando intentamos ver el tamaño de un directorio, vemos lo . . . Read more