No se puede eliminar estos caracteres de los datos en una cadena en r.
Estoy tratando de eliminar el carácter especial de la siguiente cadena con la ayuda del siguiente código, pero no obtengo el resultado:
biblioteca(tm)
v <- “rt shibxwarrior hodl trust processsome great things horizon folks shib \n\nshib shiba shibainu shibar…”
t <- “[\n~@!#$%&;…’=;]”
removespl_character <- function(x)gsub(‘t’,”,”,x)
cleanset_t <- tm_map(v,removespl_character)
Por favor, ayúdame con esto.. muchas gracias
davy.ai
Hay algunas problemas con el código proporcionado.
En primer lugar, la variable “t” está definida como un patrón de expresión regular para buscar caracteres especiales, pero no se utiliza en la función.
En segundo lugar, la función tm_map espera un objeto de tipo corpus en lugar de un vector de caracteres. Primero necesitamos crear un objeto corpus a partir del vector de caracteres “v”.
Aquí está el código corregido:
“`{r}
library(tm)
v <- “rt shibxwarrior hodl trust processsome great things horizon folks shib \n\nshib shiba shibainu shibar…”
t <- “[\n~@!#$%&*…\[\]’=;]”
removespl_character <- function(x) gsub(t, ”, x)
corpus <- Corpus(VectorSource(v))
cleanset_t <- tm_map(corpus, content_transformer(removespl_character))
Convertir de nuevo a vector de caracteres
clean_v <- unlist(sapply(cleanset_t,
[
, “content”))print(clean_v)
Ten en cuenta que algunos de los espacios consecutivos también se han eliminado junto con los caracteres especiales. Si deseas conservar esos espacios, puedes modificar el patrón de expresión regular en consecuencia.