Cómo encontrar la línea actual en ejecución desde un archivo hql.

davy.ai

July 17, 2023 at 7:26 am

Para extraer los nombres de la base de datos y de la tabla a partir de la salida del comando desc en el archivo sample.hql, puedes utilizar el siguiente comando:

hive -f sample.hql | grep -w -H -o '<nombre_columna>' | sed 's/\([^\.]*\)\.\([^\.]*\).*/\2 \1/g' | awk '{print $2 " encontrado en " $1}' | uniq

Aquí tienes una explicación de lo que hace cada paso:

hive -f sample.hql: Esto ejecuta el script de Hive sample.hql y muestra la salida en STDOUT.
grep -w -H -o '<nombre_columna>': Esto busca la coincidencia exacta de <nombre_columna> en la salida del comando anterior y muestra únicamente el patrón coincidente, con la opción -o.
sed 's/$[^\.]*$\.$[^\.]*$.*/\2 \1/g': Esto utiliza una expresión regular para extraer los nombres de la base de datos y de la tabla a partir de la salida del comando desc. Busca un patrón de <nombre_base_de_datos>.<nombre_tabla>.<nombre_columna> y lo reemplaza con <nombre_tabla> <nombre_base_de_datos>. Esto te dará una lista de pares de nombre de tabla y nombre de base de datos para cada nombre de columna coincidente.
awk '{print $2 " encontrado en " $1}': Esto reorganiza la salida para que coincida con el formato de salida deseado "<nombre_columna> encontrado en <nombre_base_de_datos>.<nombre_tabla>". Imprime la segunda columna (es decir, el nombre de la tabla), seguido de la cadena “encontrado en” y luego la primera columna (es decir, el nombre de la base de datos).
uniq: Esto elimina cualquier duplicado de la salida, en caso de que el mismo nombre de columna se encuentre en varias tablas.

Por ejemplo, si ejecutas el comando con <nombre_columna> establecido como “col_1”, la salida será algo como esto:

col_1 encontrado en db.tabla1 col_1 no encontrado en db.tabla2 col_1 encontrado en db.tabla3

Answer

davy.ai

July 17, 2023 at 7:26 am
Para extraer los nombres de la base de datos y de la tabla a partir de la salida del comando desc en el archivo sample.hql, puedes utilizar el siguiente comando:
```
hive -f sample.hql | grep -w -H -o '<nombre_columna>' | sed 's/$[^\.]*$\.$[^\.]*$.*/\2 \1/g' | awk '{print $2 " encontrado en " $1}' | uniq
```
Aquí tienes una explicación de lo que hace cada paso:
1. hive -f sample.hql: Esto ejecuta el script de Hive sample.hql y muestra la salida en STDOUT.
2. grep -w -H -o '<nombre_columna>': Esto busca la coincidencia exacta de <nombre_columna> en la salida del comando anterior y muestra únicamente el patrón coincidente, con la opción -o.
3. sed 's/$[^\.]*$\.$[^\.]*$.*/\2 \1/g': Esto utiliza una expresión regular para extraer los nombres de la base de datos y de la tabla a partir de la salida del comando desc. Busca un patrón de <nombre_base_de_datos>.<nombre_tabla>.<nombre_columna> y lo reemplaza con <nombre_tabla> <nombre_base_de_datos>. Esto te dará una lista de pares de nombre de tabla y nombre de base de datos para cada nombre de columna coincidente.
4. awk '{print $2 " encontrado en " $1}': Esto reorganiza la salida para que coincida con el formato de salida deseado "<nombre_columna> encontrado en <nombre_base_de_datos>.<nombre_tabla>". Imprime la segunda columna (es decir, el nombre de la tabla), seguido de la cadena “encontrado en” y luego la primera columna (es decir, el nombre de la base de datos).
5. uniq: Esto elimina cualquier duplicado de la salida, en caso de que el mismo nombre de columna se encuentre en varias tablas.
Por ejemplo, si ejecutas el comando con <nombre_columna> establecido como “col_1”, la salida será algo como esto:

col_1 encontrado en db.tabla1 col_1 no encontrado en db.tabla2 col_1 encontrado en db.tabla3

Comments are closed.

es.davy.ai

¿Tienes una pregunta?

Cómo encontrar la línea actual en ejecución desde un archivo hql.

Answer

davy.ai