Estoy intentando eliminar los primeros 4 caracteres de los nombres de mis columnas usando stringr. Sé cómo especificar los caracteres que quiero mantener, pero como la longitud de cada columna es diferente, necesito especificar los que no quiero mantener y no sé cómo hacerlo. ¿Cómo puedo hacer esto?
Tengo miles de secuencias de ADN que se ven así :). ref <- c(“CCTACGGTTATGTACGATTAAAGAAGATCGTCAGTC”, “CCTACGCGTTGATATTTTGCATGCTTACTCCCAGTC”, “CCTCGCGTTGATATTTTGCATGCTTACTCCCAGTC”) Necesito extraer cada secuencia entre “CTACG” y “CAGTC”. Sin embargo, muchas veces estas secuencias vienen con un error (deleción, inserción, sustitución). ¿Existe alguna forma de tener en cuenta las discrepancias basándose en la distancia . . . Read more
En el dataframe de R, quiero reemplazar todos los valores numéricos y ‘.’ por ‘otro’. Aquí está el código, hay dos métodos (quiero dos formas de resolverlo). ¿Alguien puede ayudar? ¡Gracias! library(tidyverse) test_data <- data.frame(category = c(‘.’, ‘2.1’, ‘2.33’, ‘A’, ‘B’)) # Método 1 test_data %>% mutate(category = str_replace_all(category, “[^A-B]”, . . . Read more
Estoy intentando realizar una coincidencia de 2 columnas pero sin éxito. Tengo un DF1 con 2 columnas, Id y JSON. En el segundo DF2, tengo una columna con un patrón para coincidir en cada fila con DF1$json (algo como vlookup + la función like). Como resultado, me gustaría obtener DF1$Id . . . Read more
Estoy tratando de utilizar regex en R para extraer la cadena completa dentro de corchetes, donde los corchetes contienen una palabra clave: library(stringr) test <- “asdf asiodjfojewl kjwnkjwnefkjnkf [asdf] fasdfads fewrw [keyword<1] keyword [keyword>1]” Debería devolver: keyword<1 # está bien si también devuelve [keyword<1] con los corchetes keyword>1 Mi intento . . . Read more