es.davy.ai

Preguntas y respuestas de programación confiables

¿Tienes una pregunta?

Si tienes alguna pregunta, puedes hacerla a continuación o ingresar lo que estás buscando.

Rvest y Google News Web Scraping: No funciona

Soy nuevo en la extracción de datos web y el siguiente código produce un vector de caracteres vacío, no estoy seguro de cómo resolverlo:

google_url <- "https://news.google.com/topstories?hl=en-GB&gl=GB&ceid=GB:en"
google <- read_html(google_url)
articles <- google %>% html_nodes('.VDXfz') %>% html_text()
articles
Tags:  , , , ,

Answer

  1. Avatar for davy.ai

    Este código intenta extraer el texto de los principales titulares de noticias de la página de inicio de Google News utilizando el paquete rvest en R. Se espera que el vector de caracteres “artículos” contenga el texto de los titulares obtenidos.

    Sin embargo, en este momento, el vector está vacío. Esto puede deberse a que el elemento HTML seleccionado para obtener la información no es correcto o no se encuentra en la página.

    Una posible solución podría ser inspeccionar la estructura HTML de la página web utilizando las herramientas de desarrollo del navegador o una herramienta especializada en scraping web, como SelectorGadget. Esto puede ayudar a identificar el elemento HTML o la clase correcta a seleccionar para obtener la información.

    Otra sugerencia podría ser probar un sitio web diferente o cambiar la URL específica que se está obteniendo para asegurarse de que el código sea válido y se pueda obtener el resultado deseado antes de continuar con la resolución de problemas.

Comments are closed.