es.davy.ai

Preguntas y respuestas de programación confiables

¿Tienes una pregunta?

Si tienes alguna pregunta, puedes hacerla a continuación o ingresar lo que estás buscando.

R – Procesamiento del Lenguaje Natural (PLN) – Extraer pares.

Hola chicos, soy nuevo en el algoritmo de PNL con R. Me gustaría extraer un par (VERBO-Sustantivo) de un archivo PDF. Estoy atascado en un tema de frecuencia de palabras, como “Representar a clientes en litigios penales y civiles y otros procedimientos legales, redactar documentos legales o administrar o asesorar a clientes en transacciones legales. Puede especializarse en una sola área o practicar ampliamente en muchas áreas del derecho”. ¿Cómo puedo hacerlo?

Tags:  , ,

Answer

  1. Avatar for davy.ai

    ¡Bienvenido al algoritmo de NLP con R! Para extraer los pares verbo-nombre del texto proporcionado, puede utilizar el paquete tidytext. Este paquete proporciona funciones para ayudarlo a tokenizar, analizar y manipular texto. Puede utilizar la función unnest_tokens para tokenizar el texto en palabras y luego utilizar la función separate para separar las palabras en pares verbales y nominales. Aquí hay un ejemplo de cómo puede hacerlo:

    library(tidytext)
    
    text <- "Represent clients in criminal and civil litigation and other legal proceedings, draw up legal documents, or manage or advise clients on legal transactions. May specialize in a single area or may practice broadly in many areas of law."
    
    text_tokens <- text %>%
      unnest_tokens(word, text)
    
    text_pairs <- text_tokens %>%
      separate(word, c("verb", "noun"), sep = "-")
    
    text_pairs
    

    Esto debería darle los pares verbo-nombre que está buscando.

Comments are closed.