Tag: DATA-CLEANING
Estoy tratando de eliminar el carácter especial de la siguiente cadena con la ayuda del siguiente código, pero no obtengo el resultado: biblioteca(tm) v <- “rt shibxwarrior hodl trust processsome great things horizon folks shib \n\nshib shiba shibainu shibar…” t <- “[\n~@!#$%&;…’=;]” removespl_character <- function(x)gsub(‘t’,”,”,x) cleanset_t <- tm_map(v,removespl_character) Por favor, . . . Read more
Tengo un problema muy simple. Supongamos que tengo una tabla de datos: dt = data.table(a = rnorm(10), b = rnrom(10)) Quería crear una nueva variable en dt llamada c = b * 2. Pero quería tomar el nombre de variable tanto b como c de otras variables almacenadas en una . . . Read more
Estoy intentando eliminar filas repetidas en un marco de datos basado en la siguiente condición: Si el valor de la columna pagePath es igual que en la fila anterior y el SessionId es el mismo, necesito eliminar esta fila. Si el SessionId es diferente, entonces el pagePath repetido no debería . . . Read more
Así que estoy trabajando en un proyecto donde estoy convirtiendo archivos PDF a un archivo .txt, que estoy convirtiendo a un archivo CSV utilizando Python. Entonces, estoy trabajando con este PDF: https://secure.in.gov/dcs/files/AssessmentDecisions201301.pdf y convirtiéndolo a un archivo de texto utilizando un convertidor OCR en línea. Aquí hay un fragmento de . . . Read more
Estoy trabajando con conjuntos de datos grandes que contienen caracteres especiales en los nombres de columna. Los nombres de columna se ven así: “”@cage1619da * ((df.age >= 16) & (df.age <= 19))”” o “”sovtoll_available == False””. ¿Cuál sería la mejor manera de trabajar con estos nombres? ¿Debo mantener los nombres . . . Read more