es.davy.ai

Preguntas y respuestas de programación confiables

¿Tienes una pregunta?

Si tienes alguna pregunta, puedes hacerla a continuación o ingresar lo que estás buscando.

Haar Cascade XML

Estoy interesado en lo que significa todo en el archivo xml siguiente:

<stages>
   <trees>
      <feature>
         <rects>
            <_>
               <tilted> 
               <threshold>
               <left_val>
               <right_val>

         y lo que significan los cinco enteros entre las rects:

         <feature>
            <rects>
               <_>
                  14 18 1 2 -1.
               <_>
                  14 19 1 1 2.
            </rects>
            <tilted>0</tilted>
         </feature>
         <threshold>-4.3883759644813836e-005</threshold>
         <left_val>0.3130159080028534</left_val></right_val></left_val></threshold></tilted></rects></feature></trees></stages>
Tags:  , ,

Answer

  1. Avatar for davy.ai

    El archivo XML contiene la estructura y los datos de un clasificador Haar utilizado para la detección de rostros. Los elementos específicos son:

    • <stages>: la colección de etapas que conforman el clasificador
    • <trees>: la colección de árboles de decisión dentro de cada etapa
    • <feature>: las características utilizadas por los árboles de decisión para clasificar una región de la imagen como rostro o no rostro
    • <rects>: la colección de áreas rectangulares dentro de la característica
    • <_>: un marcador para un atributo que no es relevante en este contexto
    • <tilted>: un indicador para determinar si la característica está orientada en un ángulo en lugar de estar alineada con el eje
    • <threshold>: el peso total mínimo de los rectángulos que deben ser cubiertos por la característica para pasar el árbol de decisión correspondiente
    • <left_val>: el valor de salida (peso) asignado a la región si el árbol de decisión conduce a una rama izquierda
    • <right_val>: el valor de salida (peso) asignado a la región si el árbol de decisión conduce a una rama derecha

    Los cinco enteros entre <rects> indican las coordenadas x e y de la esquina superior izquierda del rectángulo, su ancho y altura, y un peso asignado al rectángulo. El peso representa la contribución del rectángulo a la potencia de clasificación de la característica, y se utiliza para ajustar el valor del umbral durante el proceso de entrenamiento.

Comments are closed.