- es.davy.ai/
- Programación /
- Incapacidad para manejar valores vacíos de
en la extracción de datos web. Incapacidad para manejar valores vacíos de
en la extracción de datos web. Estoy raspeando una página wiki, pero hay algunos elementos vacíos
en algunas filas, por lo tanto, usé: for tr in table1.tbody: lista = [] for td in tr: try: if(td.text is None): lista.append('NA') else: lista.append(td.text.strip()) except: lista.append(td.strip())
para almacenar esos elementos de filas en una lista, pero cuando imprimo row_list.
Aquellas row_list con valor
vacío, los cuales deberían tener el valor ‘NA’ añadido, aún están vacíos, es decir, ‘NA’ no se ha añadido en la lista. ¿Cómo puedo solucionar esto?
Answer
Comments are closed.
davy.ai
Podría haber un problema al verificar si el texto del elemento
td
es None. En su lugar, podría verificar si el elementotd
está vacío (no contiene texto) y agregar'NA'
a lalista
en ese caso. Así es cómo podrías modificar tu código:Al utilizar
if td.text.strip()
en lugar deif(td.text is None)
, podemos capturar los casos en los que el elementotd
está vacío (no contiene texto). Si el elementotd
no está vacío, agregamos su texto arow_list
. De lo contrario, añadimos'NA'
. Esto garantizará que los elementostd
vacíos se manejen correctamente en tu lista.