Tag: DIFFLIB
Tengo dos diccionarios grandes de listas. Todos los elementos de las listas son cadenas de texto. Quiero comparar todos contra todos y calcular su similitud respectiva; pero el método ingenuo que utilizo es obviamente muy lento y no escala en absoluto: import numpy as np import difflib first_dict = {“first1”: . . . Read more
Tengo una columna en mi dataframe con una lista de palabras que se parecen. Quiero crear una columna de grupos para agrupar las palabras que se parecen basándome en la coincidencia de cadenas con difflib, pero sin utilizar el bucle for porque tengo 800k filas. Tengo una base de datos . . . Read more
Supongamos que hay dos archivos de código fuente escritos en Javascript (file1.js y file2.js). Quiero compararlos usando python y señalar las porciones de código diferentes que se encuentran en file1, las cuales no están presentes en file2 (básicamente las líneas de código diferentes encontradas en file1). ¿Cómo hacerlo de manera . . . Read more