es.davy.ai

Preguntas y respuestas de programación confiables

¿Tienes una pregunta?

Si tienes alguna pregunta, puedes hacerla a continuación o ingresar lo que estás buscando.

Tag: ARCHIVE

Eliminando registros duplicados con ids antiguas en SQL/ HiveQL

Tengo una tabla como la siguiente. En esta tabla tenemos múltiples registros idénticos con solo un refresh_id diferente. Pero tenemos que seleccionar los registros con el último refresh_id, por ejemplo, tenemos que eliminar las filas en negrita/resaltado ya que sus duplicados están disponibles con el último refresh_id. Por favor ayúdame . . . Read more

Pyspark – clasificación del dataframe de Hive por dos columnas rompe el dataframe.

Tengo un problema para ordenar un dataframe desde el contexto hive de HDFS. Estoy intentando ordenar un dataframe con una estructura similar a la siguiente: +—+————–+—————+ | id|parameter_name|parameter_value| +—+————–+—————+ |id1| name_en | value a | |id1| name_il | value b | |id1| address_en| value c | |id1| address_il| value d . . . Read more