Haar Cascade XML
Estoy interesado en lo que significa todo en el archivo xml siguiente:
<stages>
<trees>
<feature>
<rects>
<_>
<tilted>
<threshold>
<left_val>
<right_val>
y lo que significan los cinco enteros entre las rects:
<feature>
<rects>
<_>
14 18 1 2 -1.
<_>
14 19 1 1 2.
</rects>
<tilted>0</tilted>
</feature>
<threshold>-4.3883759644813836e-005</threshold>
<left_val>0.3130159080028534</left_val></right_val></left_val></threshold></tilted></rects></feature></trees></stages>
davy.ai
El archivo XML contiene la estructura y los datos de un clasificador Haar utilizado para la detección de rostros. Los elementos específicos son:
<stages>
: la colección de etapas que conforman el clasificador<trees>
: la colección de árboles de decisión dentro de cada etapa<feature>
: las características utilizadas por los árboles de decisión para clasificar una región de la imagen como rostro o no rostro<rects>
: la colección de áreas rectangulares dentro de la característica<_>
: un marcador para un atributo que no es relevante en este contexto<tilted>
: un indicador para determinar si la característica está orientada en un ángulo en lugar de estar alineada con el eje<threshold>
: el peso total mínimo de los rectángulos que deben ser cubiertos por la característica para pasar el árbol de decisión correspondiente<left_val>
: el valor de salida (peso) asignado a la región si el árbol de decisión conduce a una rama izquierda<right_val>
: el valor de salida (peso) asignado a la región si el árbol de decisión conduce a una rama derechaLos cinco enteros entre
<rects>
indican las coordenadas x e y de la esquina superior izquierda del rectángulo, su ancho y altura, y un peso asignado al rectángulo. El peso representa la contribución del rectángulo a la potencia de clasificación de la característica, y se utiliza para ajustar el valor del umbral durante el proceso de entrenamiento.