Tag: ARCHIVE

Eliminando registros duplicados con ids antiguas en SQL/ HiveQL

03 Jun, 2023 Programación 0

Tengo una tabla como la siguiente. En esta tabla tenemos múltiples registros idénticos con solo un refresh_id diferente. Pero tenemos que seleccionar los registros con el último refresh_id, por ejemplo, tenemos que eliminar las filas en negrita/resaltado ya que sus duplicados están disponibles con el último refresh_id. Por favor ayúdame . . . Read more

Pyspark – clasificación del dataframe de Hive por dos columnas rompe el dataframe.

31 May, 2023 Programación 0

¿Cómo obtener una vista completa de los datos de dos tablas en Hive?

29 May, 2023 Programación 0

Tengo dos tablas en Hive (arch y noarch) con la siguiente estructura: Table1Arch Table2NoArch trid trid resid resid infojson infojson createdat updatedat Necesito obtener una vista completa de datos de arch + noarch y unirlos por res_id. Intenté hacer diferentes variaciones de uniones izquierdas, pero estaba obteniendo resultados solo de . . . Read more

Inserte un gran dataframe en una tabla Hadoop utilizando Python.

29 May, 2023 Programación 0

Tengo un gran marco de datos df para el cual se adjuntó la imagen de muestra a continuación. Contiene 47.000 filas que quiero insertar en una tabla Hadoop. La tabla en la que quiero insertar estos datos tiene todas las columnas string.. Todas las columnas en el marco de datos . . . Read more

Convertir la columna de String que tiene AM/PM a Timestamp en Impala.

29 May, 2023 Programación 0

Tienes una columna que tiene valores en tipo string como los siguientes: 31-Oct-2016 12:00 AM 31-May-2015 12:00 PM Quiero convertir los valores de la columna a timestamp en IMPALA. Lo he intentado con “cast”, “to_timestamp” y otras formas, pero me muestra un error de sintaxis o resultado nulo. ¿Podría sugerirme . . . Read more

1 … 20 21 22 … 24

es.davy.ai

¿Tienes una pregunta?

Tag: ARCHIVE

Eliminando registros duplicados con ids antiguas en SQL/ HiveQL

Pyspark – clasificación del dataframe de Hive por dos columnas rompe el dataframe.

¿Cómo obtener una vista completa de los datos de dos tablas en Hive?

Inserte un gran dataframe en una tabla Hadoop utilizando Python.

Convertir la columna de String que tiene AM/PM a Timestamp en Impala.