Tag: WEB-SCRAPING
Estoy comenzando con Selenium y estoy tratando de localizar el botón “Siguiente” en el sitio de CNN y, si no es la última página, hacer clic en él; de lo contrario, finalizar el programa. El código HTML para el botón habilitado es: <div class=”pagination-arrow pagination-arrow-right cnnSearchPageLink text-active”> “Siguiente” <i class=”icon . . . Read more
Hay un código HTML, algo como esto <strong>Link group name 1</strong> <br> <a>Link_1</a> <a>Link_2</a> <a>Link_3</a> <br> <strong>Link group name 2</strong> <a>Link_1</a> <a>Link_2</a> <br> <br> <strong>Link group nameк 3</strong> <a>Link_1</a> Necesito imprimir estos datos en esta forma: Link group name 1 – Link_1 Link group name 1 – Link_2 Link group . . . Read more
Obtengo errores de caracteres en python al realizar web scraping. from requests_html import HTML</p> <p>with open(‘list.html’, ‘r’, encoding=’cp932′, errors=’ignore’) as html<em>file: source = html</em>file.read() html = HTML(html=source)</p> <p>video<em>link = html.find(‘a’, first=True).text print(video</em>link) <code> **La línea que abre en html es esta** </code> <dt><a href=”https://www.youtube.com/watch?v=OAJn4XRhr10″> (15) アイナ・ジ・エンド (BiSH) / きえないで [OFFiCiAL . . . Read more
Estoy tratando de extraer información de un sitio web utilizando Selenium. Puedo abrir la mayoría de los sitios web, pero hay algunos que me devuelven la respuesta 406 Not Acceptable. En lugar de recibir el sitio web real, solo obtengo un mensaje 406 Not Acceptable en el navegador. Actualmente estoy . . . Read more
Ejecuto un JavaScript con driver.execute_script pero NADA ocurre cuando lo hago. El sistema simplemente pasa a la siguiente línea de código de Python. ¿Alguna idea? Web scraping en una página web, utilizando JavaScript en la consola para extraer datos. El script funciona perfectamente cuando yo lo coloco en la consola . . . Read more