Tag: STRINGDIST
Hola, estoy tratando de encontrar una cadena en otra cadena en diferentes marcos de datos y obtener las n coincidencias más cercanas basadas en la puntuación. Por ejemplo, desde la cadena 2 (df2), necesito encontrar coincidencias con la cadena 1 (df1) y obtener las 3 coincidencias más cercanas según cada . . . Read more
Tengo miles de secuencias de ADN que se ven así :). ref <- c(“CCTACGGTTATGTACGATTAAAGAAGATCGTCAGTC”, “CCTACGCGTTGATATTTTGCATGCTTACTCCCAGTC”, “CCTCGCGTTGATATTTTGCATGCTTACTCCCAGTC”) Necesito extraer cada secuencia entre “CTACG” y “CAGTC”. Sin embargo, muchas veces estas secuencias vienen con un error (deleción, inserción, sustitución). ¿Existe alguna forma de tener en cuenta las discrepancias basándose en la distancia . . . Read more
Tengo un conjunto de datos muy grande que se ve así. Tengo dos tipos de marcos de datos: 1. mi marco de datos de referencia ref=c(“cake”,”brownies”) y mi marco de datos experimental expr=c(“cak”,”cakee”,”cake”, “rownies”,”browwnies”) Quiero comparar los marcos de datos ref y expr y encontrar la distancia de Levenshtein entre . . . Read more