Tag: ELEMENTTREE
Estoy utilizando elementree para extraer datos de HTML en un formato que ha evolucionado en su estructura a lo largo del tiempo (ver ejemplos a continuación). Actualmente lo estoy haciendo utilizando iterfind para encontrar diferentes bloques de estructura coincidentes (font/b, b/font, font). Pero he notado que hay un patrón general. . . . Read more
Tengo archivos xml con secciones grandes < div id=”XY”> que contienen texto etiquetado. Necesito analizar el contenido eliminando las etiquetas hijas o reemplazándolas para crear enlaces html. Este es el contenido de sample.xml: <BODY><ENTRY id=”AB”>Blabla</ENTRY> <ENTRY id=”XY”> This is the city of <LOC ref=”at0001″>Vienna</LOC>, which until <YEAR>1918</YEAR> blablabla</ENTRY></BODY> Este es . . . Read more
Mi pregunta ad-hoc se refiere a lo siguiente: Dada esta estructura XML (guardada en xml_FILE): <countriesAndStates> <countries> <name>USA</name> <states> <active>true</active> <stateName>Colorado</stateName> <isoCode>CO</isoCode> </states> <states> <active>false</active> <stateName>Florida</stateName> <isoCode>FL</isoCode> </states> </countries> </countriesAndStates> Recorro el nivel del elemento state utilizando este bucle for y guardo el resultado en un diccionario de listas con . . . Read more
Una pregunta de novato sobre XML. Estoy usando ElementTree para convertir el XML en un df y eventualmente cargarlo en una base de datos. Mi problema es que el formato XML no es estándar. Todos los ejemplos de ElementTree que he visto usan un formato diferente. Se ve algo así: . . . Read more
No estoy familiarizado en absoluto con los archivos XML, pero estoy intentando analizar esto: <?xml version=”1.0″ encoding=”ISO-8859-1″?> <modeling> <generator> <i name=”subversion” type=”string”>(build Dec 07 2018 23:19:03) complex parallel </i> <i name=”platform” type=”string”>LinuxIFC </i> <i name=”date” type=”string”>2019 07 11 </i> <i name=”time” type=”string”>11:56:12 </i> </generator> <incar> <i type=”int” name=”ISTART”> 0</i> <i . . . Read more