Tag: NLTK

Buscar todas las palabras en una oración relacionadas con una palabra clave.

31 Jul, 2023 Programación 0

Tengo el siguiente texto y quiero aislar una parte de la oración relacionada con una palabra clave, en este caso keywords = [‘pizza’, ‘chips’]. text = “The pizza is great but the chips aren’t the best” Salida esperada: {‘pizza’: ‘The pizza is great’} {‘chips’: “the chips aren’t the best”} He . . . Read more

AWS Lambda y NLTK: Recurso wordnet no encontrado

29 Jul, 2023 Programación 0

Sé que esta pregunta ha sido respondida en muchos lugares, pero desafortunadamente ninguna de las soluciones mencionadas está funcionando para mí. Así que voy a detallar aquí mi desafío: Había escrito un programa local de Python con las siguientes importaciones, que funcionaba muy bien. Después de la primera descarga de . . . Read more

¿Cómo traduciría “corpus to text with nltk” al español?

24 Jul, 2023 Programación 0

Hola, descargué un corpus utilizando NLTK. phrase = nltk.corpus.conll2002.iob_sents(‘esp.testb’)[0] Eso devuelve: [(‘La’, ‘DA’, ‘B-LOC’), (‘Coruña’, ‘NC’, ‘I-LOC’), (‘,’, ‘Fc’, ‘O’), (’23’, ‘Z’, ‘O’), (‘may’, ‘NC’, ‘O’), (‘(‘, ‘Fpa’, ‘O’), (‘EFECOM’, ‘NP’, ‘B-ORG’), La pregunta es cómo puedo obtener la oración completa. Estoy utilizando el siguiente código: ‘ ‘.join([w[0] for w . . . Read more

Cómo importar y leer un corpus wsj en python

23 Jul, 2023 Programación 0

Tengo un código que construye un modelo de n-gramas para probar la predicción de la siguiente palabra basada en un corpus proporcionado. ¿Cómo puedo reemplazar el corpus dado para leer el corpus de WSJ como corpus de entrenamiento? A continuación se muestra una parte del programa. import nltk, re, pprint, . . . Read more

Cómo mantener caracteres especiales juntos en word_tokenize?

22 Jul, 2023 Programación 0

Tengo un problema de procesamiento del lenguaje natural (NLP) que involucra algunas tareas de codificación como “fnpunto->extraer&aislarr” y cuando uso word_tokenize, el operador de asignación “->” se divide de la siguiente manera ["fn_punto-", ">", "extraer.aislar_r"]. Hice lo siguiente: from nltk.tokenize import word_tokenize oracion = "La lista funcional fn_punto->extraer.aislar_r de tamaño . . . Read more

1 2 … 6

es.davy.ai

¿Tienes una pregunta?