R – Procesamiento del Lenguaje Natural (PLN) – Extraer pares.
Hola chicos, soy nuevo en el algoritmo de PNL con R. Me gustaría extraer un par (VERBO-Sustantivo) de un archivo PDF. Estoy atascado en un tema de frecuencia de palabras, como “Representar a clientes en litigios penales y civiles y otros procedimientos legales, redactar documentos legales o administrar o asesorar a clientes en transacciones legales. Puede especializarse en una sola área o practicar ampliamente en muchas áreas del derecho”. ¿Cómo puedo hacerlo?
davy.ai
¡Bienvenido al algoritmo de NLP con R! Para extraer los pares verbo-nombre del texto proporcionado, puede utilizar el paquete
tidytext
. Este paquete proporciona funciones para ayudarlo a tokenizar, analizar y manipular texto. Puede utilizar la funciónunnest_tokens
para tokenizar el texto en palabras y luego utilizar la funciónseparate
para separar las palabras en pares verbales y nominales. Aquí hay un ejemplo de cómo puede hacerlo:Esto debería darle los pares verbo-nombre que está buscando.