es.davy.ai

Preguntas y respuestas de programación confiables

¿Tienes una pregunta?

Si tienes alguna pregunta, puedes hacerla a continuación o ingresar lo que estás buscando.

Tag: NLTK

AWS Lambda y NLTK: Recurso wordnet no encontrado

Sé que esta pregunta ha sido respondida en muchos lugares, pero desafortunadamente ninguna de las soluciones mencionadas está funcionando para mí. Así que voy a detallar aquí mi desafío: Había escrito un programa local de Python con las siguientes importaciones, que funcionaba muy bien. Después de la primera descarga de . . . Read more

¿Cómo traduciría “corpus to text with nltk” al español?

Hola, descargué un corpus utilizando NLTK. phrase = nltk.corpus.conll2002.iob_sents(‘esp.testb’)[0] Eso devuelve: [(‘La’, ‘DA’, ‘B-LOC’), (‘Coruña’, ‘NC’, ‘I-LOC’), (‘,’, ‘Fc’, ‘O’), (’23’, ‘Z’, ‘O’), (‘may’, ‘NC’, ‘O’), (‘(‘, ‘Fpa’, ‘O’), (‘EFECOM’, ‘NP’, ‘B-ORG’), La pregunta es cómo puedo obtener la oración completa. Estoy utilizando el siguiente código: ‘ ‘.join([w[0] for w . . . Read more

Cómo importar y leer un corpus wsj en python

Tengo un código que construye un modelo de n-gramas para probar la predicción de la siguiente palabra basada en un corpus proporcionado. ¿Cómo puedo reemplazar el corpus dado para leer el corpus de WSJ como corpus de entrenamiento? A continuación se muestra una parte del programa. import nltk, re, pprint, . . . Read more

Cómo mantener caracteres especiales juntos en word_tokenize?

Tengo un problema de procesamiento del lenguaje natural (NLP) que involucra algunas tareas de codificación como “fnpunto->extraer&aislarr” y cuando uso word_tokenize, el operador de asignación “->” se divide de la siguiente manera ["fn_punto-", ">", "extraer.aislar_r"]. Hice lo siguiente: from nltk.tokenize import word_tokenize oracion = "La lista funcional fn_punto->extraer.aislar_r de tamaño . . . Read more