Tag: ARCHIVE
Tengo una tabla como la siguiente. En esta tabla tenemos múltiples registros idénticos con solo un refresh_id diferente. Pero tenemos que seleccionar los registros con el último refresh_id, por ejemplo, tenemos que eliminar las filas en negrita/resaltado ya que sus duplicados están disponibles con el último refresh_id. Por favor ayúdame . . . Read more
Tengo un problema para ordenar un dataframe desde el contexto hive de HDFS. Estoy intentando ordenar un dataframe con una estructura similar a la siguiente: +—+————–+—————+ | id|parameter_name|parameter_value| +—+————–+—————+ |id1| name_en | value a | |id1| name_il | value b | |id1| address_en| value c | |id1| address_il| value d . . . Read more
Tengo dos tablas en Hive (arch y noarch) con la siguiente estructura: Table1Arch Table2NoArch trid trid resid resid infojson infojson createdat updatedat Necesito obtener una vista completa de datos de arch + noarch y unirlos por res_id. Intenté hacer diferentes variaciones de uniones izquierdas, pero estaba obteniendo resultados solo de . . . Read more
Tengo un gran marco de datos df para el cual se adjuntó la imagen de muestra a continuación. Contiene 47.000 filas que quiero insertar en una tabla Hadoop. La tabla en la que quiero insertar estos datos tiene todas las columnas string.. Todas las columnas en el marco de datos . . . Read more
Tienes una columna que tiene valores en tipo string como los siguientes: 31-Oct-2016 12:00 AM 31-May-2015 12:00 PM Quiero convertir los valores de la columna a timestamp en IMPALA. Lo he intentado con “cast”, “to_timestamp” y otras formas, pero me muestra un error de sintaxis o resultado nulo. ¿Podría sugerirme . . . Read more