Tag: DATA-CLEANING

No se puede eliminar estos caracteres de los datos en una cadena en r.

16 Jul, 2023 Programación 0

Estoy tratando de eliminar el carácter especial de la siguiente cadena con la ayuda del siguiente código, pero no obtengo el resultado: biblioteca(tm) v <- “rt shibxwarrior hodl trust processsome great things horizon folks shib \n\nshib shiba shibainu shibarâ€¦” t <- “[\n~@!#$%&;â€¦’=;]” removespl_character <- function(x)gsub(‘t’,”,”,x) cleanset_t <- tm_map(v,removespl_character) Por favor, . . . Read more

Crear una variable en data.table con la variable guardada en otra variable.

16 Jul, 2023 Programación 0

Tengo un problema muy simple. Supongamos que tengo una tabla de datos: dt = data.table(a = rnorm(10), b = rnrom(10)) Quería crear una nueva variable en dt llamada c = b * 2. Pero quería tomar el nombre de variable tanto b como c de otras variables almacenadas en una . . . Read more

Eliminar filas repetidas en un DataFrame basándose en una condición en pandas.

16 Jul, 2023 Programación 0

Estoy intentando eliminar filas repetidas en un marco de datos basado en la siguiente condición: Si el valor de la columna pagePath es igual que en la fila anterior y el SessionId es el mismo, necesito eliminar esta fila. Si el SessionId es diferente, entonces el pagePath repetido no debería . . . Read more

Limpiando archivo de texto de números para crear CSV

16 Jul, 2023 Programación 0

Así que estoy trabajando en un proyecto donde estoy convirtiendo archivos PDF a un archivo .txt, que estoy convirtiendo a un archivo CSV utilizando Python. Entonces, estoy trabajando con este PDF: https://secure.in.gov/dcs/files/AssessmentDecisions201301.pdf y convirtiéndolo a un archivo de texto utilizando un convertidor OCR en línea. Aquí hay un fragmento de . . . Read more

¿Cuál es la mejor forma de trabajar con conjuntos de datos que contienen caracteres especiales en los nombres de sus columnas en R?

15 Jul, 2023 Programación 0

Estoy trabajando con conjuntos de datos grandes que contienen caracteres especiales en los nombres de columna. Los nombres de columna se ven así: “”@cage1619da * ((df.age >= 16) & (df.age <= 19))”” o “”sovtoll_available == False””. ¿Cuál sería la mejor manera de trabajar con estos nombres? ¿Debo mantener los nombres . . . Read more

1 … 4 5 6 … 10

es.davy.ai

¿Tienes una pregunta?

Tag: DATA-CLEANING

No se puede eliminar estos caracteres de los datos en una cadena en r.

Crear una variable en data.table con la variable guardada en otra variable.

Eliminar filas repetidas en un DataFrame basándose en una condición en pandas.

Limpiando archivo de texto de números para crear CSV

¿Cuál es la mejor forma de trabajar con conjuntos de datos que contienen caracteres especiales en los nombres de sus columnas en R?