Tag: NLTK
Tengo el siguiente def que termina con una función de impresión: from nltk.corpus import words nltk.download('words') correct_spellings = words.words() from nltk.metrics.distance import jaccard_distance from nltk.util import ngrams from nltk.metrics.distance import edit_distance def answer_nine(entries=['cormulent', 'incendenece', 'validrate']): for entry in entries: temp = [(jaccard_distance(set(ngrams(entry, 2)), set(ngrams(w, 2))),w) for w in correct_spellings if . . . Read more
¿Cómo escribiría esto en una función que produzca la misma salida? from nltk.book import text2 sorted([word.lower() for word in text2 if len(word)>4 and len(word)<12])
He descargado un corpus y tokenizado las palabras. Tengo una lista de los personajes principales y quiero saber cuántas veces aparece cada nombre en el corpus. He intentado usar una función de frecuencia con un diccionario, pero no sé cómo obtener el recuento de nombres. targeturl0 = ‘http://www.gutenberg.org/files/135/135-0.txt’ bookraw = . . . Read more
Soy un traductor de español que traduce documentos de TI. Traduzca lo siguiente al español. No traduzca el código y la salida en markdown. Soy un novato usando python. Ahora estoy haciendo procesamiento de lenguaje natural para una novela y elijo cargar el libro desde nltk.corpus.gutenberg.fileids (). Solo uso ‘Sense . . . Read more
Estoy intentando limpiar mi conjunto de datos usando NLTK, pero tengo algunos problemas, ya que está tardando mucho en completarse. Tengo un conjunto de datos muy grande con más de 20000+ filas de texto. El código que estoy ejecutando se ve así: from nltk.corpus import words nltk.download(‘words’) gibberishBody = [] . . . Read more