Estoy intentando scrape el ranking de universidades QS del mundo con Python.

davy.ai

June 4, 2023 at 3:34 am

Para extraer los nombres de las universidades, sus clasificaciones y reputación académica del sitio web de QS ranking, se pueden seguir los siguientes pasos:

Obtener la URL del sitio web de QS ranking.
Usar el módulo de requests para obtener el contenido HTML de la página web.
Crear un objeto BeautifulSoup con el contenido HTML.
Encontrar la tabla que contiene los datos que necesitamos. Esto se puede hacer buscando la tabla que tiene la clase “ranking-data-table”.
Encontrar las filas de la tabla. Esto se puede hacer encontrando todas las etiquetas “tr” dentro de la tabla.
Hacer un bucle a través de las filas de la tabla y extraer los datos que necesitamos de cada fila. El nombre de la universidad se puede encontrar dentro de la etiqueta “td” con la clase “uni-link”. La clasificación se puede encontrar dentro de la etiqueta “td” con la clase “rank”. La reputación académica se puede encontrar dentro de la etiqueta “td” con la clase “reputation”.

Aquí está el código:

from bs4 import BeautifulSoup
import requests

url = "https://www.topuniversities.com/university-rankings/world-university-rankings/2022"
response = requests.get(url)

soup = BeautifulSoup(response.text, "html.parser")

table = soup.find("table", class_="ranking-data-table")
rows = table.find_all("tr")

for row in rows:
    cells = row.find_all("td")
    if len(cells) == 3:
        name = cells[0].find("a", class_="uni-link").text
        rank = cells[1].find("div", class_="rank").text
        reputation = cells[2].find("div", class_="reputation").text
        print(name, rank, reputation)

Este código extraerá e imprimirá los nombres de las universidades, sus clasificaciones y reputaciones académicas para todas las universidades en el sitio web de QS ranking.

Answer

davy.ai

June 4, 2023 at 3:34 am
Para extraer los nombres de las universidades, sus clasificaciones y reputación académica del sitio web de QS ranking, se pueden seguir los siguientes pasos:
1. Obtener la URL del sitio web de QS ranking.
2. Usar el módulo de requests para obtener el contenido HTML de la página web.
3. Crear un objeto BeautifulSoup con el contenido HTML.
4. Encontrar la tabla que contiene los datos que necesitamos. Esto se puede hacer buscando la tabla que tiene la clase “ranking-data-table”.
5. Encontrar las filas de la tabla. Esto se puede hacer encontrando todas las etiquetas “tr” dentro de la tabla.
6. Hacer un bucle a través de las filas de la tabla y extraer los datos que necesitamos de cada fila. El nombre de la universidad se puede encontrar dentro de la etiqueta “td” con la clase “uni-link”. La clasificación se puede encontrar dentro de la etiqueta “td” con la clase “rank”. La reputación académica se puede encontrar dentro de la etiqueta “td” con la clase “reputation”.
Aquí está el código:
```
from bs4 import BeautifulSoup
import requests

url = "https://www.topuniversities.com/university-rankings/world-university-rankings/2022"
response = requests.get(url)

soup = BeautifulSoup(response.text, "html.parser")

table = soup.find("table", class_="ranking-data-table")
rows = table.find_all("tr")

for row in rows:
    cells = row.find_all("td")
    if len(cells) == 3:
        name = cells[0].find("a", class_="uni-link").text
        rank = cells[1].find("div", class_="rank").text
        reputation = cells[2].find("div", class_="reputation").text
        print(name, rank, reputation)
```
Este código extraerá e imprimirá los nombres de las universidades, sus clasificaciones y reputaciones académicas para todas las universidades en el sitio web de QS ranking.

Comments are closed.

es.davy.ai

¿Tienes una pregunta?

Estoy intentando scrape el ranking de universidades QS del mundo con Python.

Answer

davy.ai