Tag: DATA-CLEANING
Estoy tratando de organizar algunos datos que están contenidos en una columna llamada “game_info” como una cadena de texto. Estos datos contienen información sobre los próximos partidos de baloncesto universitario, con la Fecha, Hora, IDs de los equipos, Nombres de los equipos, etc. Idealmente, cada uno de estos elementos debería . . . Read more
Tengo un marco de datos estructurado de la siguiente manera: MesAño Total 01/2020 c(1, 1, 1, 1, 1…) 02/2020 c(2, 14, 6, 12, 91…) … … ¿Cómo puedo hacer este marco de datos para poder sumar todos los valores en cada vector y almacenarlos nuevamente en el marco de datos? . . . Read more
Tengo un archivo de texto con muchas líneas, que incluyen palabras y números, aquí hay un ejemplo: 2021-12-06 05:07:09.266 INFO: ID adicional 1638301749791 2021-12-06 05:07:09.266 INFO: Encontrado 2021-12-06 05:07:09.267 INFO: ObjectStatus-ok factor 1163 factor cinco y seis calculado como antes mejor peso ID 1638301749796 2021-12-06 05:07:09.267 INFO: deshabilitado; computando el . . . Read more
Estoy intentando limpiar algunas fechas en conjuntos de datos enormes y soy nuevo en Python (he usado Google para buscar mi problema), así que por favor ten paciencia con mi terminología. Los datos se importan de un archivo CSV a un pandas.core.frame.DataFrame. Algunas de mis columnas solo deberían contener números . . . Read more
Tengo una tabla con muchas entidades de empresas aparentemente duplicadas (tblOrganisations), por ejemplo: ID Nombre 1 Empresa 1 2 Empresa Uno 3 EmpresaUno 4 Empresa Uno 5 Empresa Uno (Pty)Ltd 6 Empresa 1(Pty) Ltd 7 Empresa Uno Pty Ltd 8 Negocio 1 9 Negocio Uno 10 NegocioUno 11 Negocio Uno . . . Read more