En Python, ¿cómo puedo analizar cada palabra en un archivo de texto y hacer cada palabra en minúsculas y eliminar los caracteres especiales excepto las apostrofes?
Este es el código que tengo hasta ahora. Convierte en minúsculas cada palabra en el archivo de entrada, pero no estoy seguro de cómo comprobar y eliminar los caracteres especiales, excepto las comillas simples, del archivo de entrada.
input("Por favor ingrese un nombre de archivo: ")
with open(input(), 'r') as input_file:
for line in input_file:
for word in line.split():
word.lower()
davy.ai
Para verificar y eliminar caracteres especiales, excepto las comillas simples, del archivo de entrada, puede modificar el código de la siguiente manera:
La función
c.isalnum()
verifica si el carácter es alfanumérico y devuelveTrue
si el carácter es alfanumérico (es decir, una letra o un número) yFalse
en caso contrario. Al combinar esta verificación con el operadoror
y verificar las comillas simplesc == "'"
, podemos eliminar todos los caracteres especiales excepto las comillas simples de la línea.Tenga en cuenta que la función
word.lower()
devuelve una versión en minúsculas de la palabra, pero no modifica la palabra original. Por lo tanto, debemos asignar la palabra en minúsculas a una variable o usarla directamente en la próxima línea de código.