Tag: PYTHON-REGEX
Estoy desarrollando un programa para leer un archivo CSV y crear un diccionario de información a partir de él. Cada línea del CSV es esencialmente una nueva entrada de diccionario en donde los objetos delimitados son los valores. Como parte de una sub-tarea, necesito extraer un número desconocido de dígitos . . . Read more
Estoy tratando de encontrar palabras en un corpus que tengan letras (específicamente aeiouy) que aparezcan en las palabras en ese orden (como “facetiously”). Tengo el siguiente código hasta ahora, pero estoy luchando por cómo hacer que tenga la condición de que deben estar en el siguiente orden. english = nltk.corpus.words.words() . . . Read more
Me gustaría crear un diccionario para separar todos los elementos de una fórmula molecular. Intenté usar el módulo re. Formula=”C16H21NO2Na3″ pat = re.compile(‘(?P[A-Z][a-z]+)[0-9]+(?P[0-9]+)’) molecule= pat.findall(Formula) print (molecule) Espero este resultado: {‘C’: 16, ‘H’: 21, ‘N’: ”, ‘O’: 2, ‘Na’: 3}
Tiene la siguiente cadena: cadena = ‘”General Slocum” 15 de junio de 1904. East River _ factor humano %_ %& 4′ Q: Usando RegEx, extraiga toda la cadena excepto las subcadenas que comiencen con S. Código para encontrar la subcadena que comienza con S: print(re.findall(‘S[\w]+’, cadena) Salida: [‘Slocum’] La mejor . . . Read more
Tengo una lista en un archivo de texto de URLs con algunos textos no deseados. Escribí una expresión regular que cumple con mis necesidades y funciona bien, pero estoy enfrentando un problema donde la expresión regular agrega muestras no deseadas [”] al resultado debajo de los ejemplos: Contenido del archivo . . . Read more