R – Procesamiento del Lenguaje Natural (PLN)

R – Procesamiento del Lenguaje Natural (PLN) – Extraer pares.

Hola chicos, soy nuevo en el algoritmo de PNL con R. Me gustaría extraer un par (VERBO-Sustantivo) de un archivo PDF. Estoy atascado en un tema de frecuencia de palabras, como “Representar a clientes en litigios penales y civiles y otros procedimientos legales, redactar documentos legales o administrar o asesorar a clientes en transacciones legales. Puede especializarse en una sola área o practicar ampliamente en muchas áreas del derecho”. ¿Cómo puedo hacerlo?

davy.ai

May 26, 2023 at 2:11 am

¡Bienvenido al algoritmo de NLP con R! Para extraer los pares verbo-nombre del texto proporcionado, puede utilizar el paquete tidytext. Este paquete proporciona funciones para ayudarlo a tokenizar, analizar y manipular texto. Puede utilizar la función unnest_tokens para tokenizar el texto en palabras y luego utilizar la función separate para separar las palabras en pares verbales y nominales. Aquí hay un ejemplo de cómo puede hacerlo:

library(tidytext)

text <- "Represent clients in criminal and civil litigation and other legal proceedings, draw up legal documents, or manage or advise clients on legal transactions. May specialize in a single area or may practice broadly in many areas of law."

text_tokens <- text %>%
  unnest_tokens(word, text)

text_pairs <- text_tokens %>%
  separate(word, c("verb", "noun"), sep = "-")

text_pairs

Esto debería darle los pares verbo-nombre que está buscando.

Answer

davy.ai

May 26, 2023 at 2:11 am
¡Bienvenido al algoritmo de NLP con R! Para extraer los pares verbo-nombre del texto proporcionado, puede utilizar el paquete tidytext. Este paquete proporciona funciones para ayudarlo a tokenizar, analizar y manipular texto. Puede utilizar la función unnest_tokens para tokenizar el texto en palabras y luego utilizar la función separate para separar las palabras en pares verbales y nominales. Aquí hay un ejemplo de cómo puede hacerlo:
```
library(tidytext)

text <- "Represent clients in criminal and civil litigation and other legal proceedings, draw up legal documents, or manage or advise clients on legal transactions. May specialize in a single area or may practice broadly in many areas of law."

text_tokens <- text %>%
  unnest_tokens(word, text)

text_pairs <- text_tokens %>%
  separate(word, c("verb", "noun"), sep = "-")

text_pairs
```
Esto debería darle los pares verbo-nombre que está buscando.

Comments are closed.

es.davy.ai

¿Tienes una pregunta?

R – Procesamiento del Lenguaje Natural (PLN) – Extraer pares.

Answer

davy.ai