Tag: NLTK

¿Cómo puedo agregar el resultado de una función de impresión a una lista?

11 Jul, 2023 Programación 0

Tengo el siguiente def que termina con una función de impresión: from nltk.corpus import words nltk.download('words') correct_spellings = words.words() from nltk.metrics.distance import jaccard_distance from nltk.util import ngrams from nltk.metrics.distance import edit_distance def answer_nine(entries=['cormulent', 'incendenece', 'validrate']): for entry in entries: temp = [(jaccard_distance(set(ngrams(entry, 2)), set(ngrams(w, 2))),w) for w in correct_spellings if . . . Read more

¿Cómo escribo esto en una función en Python 3?

17 Jun, 2023 Programación 0

¿Cómo escribiría esto en una función que produzca la misma salida? from nltk.book import text2 sorted([word.lower() for word in text2 if len(word)>4 and len(word)<12])

¿Cómo encontrar una lista de palabras en un corpus utilizando NLTK? No puedo encontrar la frecuencia de las palabras.

11 Jun, 2023 Programación 0

He descargado un corpus y tokenizado las palabras. Tengo una lista de los personajes principales y quiero saber cuántas veces aparece cada nombre en el corpus. He intentado usar una función de frecuencia con un diccionario, pero no sé cómo obtener el recuento de nombres. targeturl0 = ‘http://www.gutenberg.org/files/135/135-0.txt’ bookraw = . . . Read more

Cómo hacer análisis de capítulos en libros importados de nltk.corpus.gutenberg.fileids().

11 Jun, 2023 Programación 0

Soy un traductor de español que traduce documentos de TI. Traduzca lo siguiente al español. No traduzca el código y la salida en markdown. Soy un novato usando python. Ahora estoy haciendo procesamiento de lenguaje natural para una novela y elijo cargar el libro desde nltk.corpus.gutenberg.fileids (). Solo uso ‘Sense . . . Read more

Python | Cuaderno Jupyter – función NLTK lenta al verificación de palabras.

05 Jun, 2023 Programación 0

Estoy intentando limpiar mi conjunto de datos usando NLTK, pero tengo algunos problemas, ya que está tardando mucho en completarse. Tengo un conjunto de datos muy grande con más de 20000+ filas de texto. El código que estoy ejecutando se ve así: from nltk.corpus import words nltk.download(‘words’) gibberishBody = [] . . . Read more

1 … 3 4 5 6

es.davy.ai

¿Tienes una pregunta?