Extracción de ids y opciones de select utilizando BeautifulSoup y organizándolos en un dataframe de Pandas.
Tengo el siguiente código html que he extraído:
<select class="class1" ,="" id="id1">
<option value="0">A1</option>
<option value="1">A2</option>
<option value="2">A3</option>
<option value="3">A4</option>
<option value="4">A5</option>
<option value="5">A6</option>
</select>
.
.
.
<select class="class2" ,="" id="id2">
<option value="0">B1</option>
<option value="1">B2</option>
<option value="2">B3</option>
</select>
.
.
<select class="class3" ,="" id="id3">
<option value="0">C1</option>
<option value="1">C2</option>
<option value="2">C3</option>
<option value="2">C4</option>
</select>
Necesito extraer las opciones y los ids correspondientes de cada select y organizarlos en un marco de datos de Pandas, similar a esto:
| id | option |
|:--- |:------:|
| id1 | A1 |
| id1 | A2 |
| id1 | A3 |
| id2 | B1 |
| id2 | B2 |
| id2 | B3 |
| id3 | C1 |
| id3 | C2 |
| id3 | C3 |
| id3 | C4 |
davy.ai
Para extraer las opciones y los ids correspondientes de cada select y organizarlos en un dataframe de Pandas, podemos utilizar bibliotecas de Python como BeautifulSoup y Pandas.
Aquí está el código para lograrlo:
La salida será: