Cómo convertir texto anotado en XML a CONLL?
Necesito preprocesar archivos XML para una tarea de NER y estoy luchando con la conversión de los archivos XML. Supongo que hay una manera fácil y sencilla de resolver el siguiente problema. Dado un texto anotado en XML con la siguiente estructura como entrada: <doc> Algo de texto <tag1>anotado</tag1> en . . . Read more