es.davy.ai

Preguntas y respuestas de programación confiables

¿Tienes una pregunta?

Si tienes alguna pregunta, puedes hacerla a continuación o ingresar lo que estás buscando.

¿Recortar el área etiquetada en una imagen separada en Computer Vision Annotation (CVAT)?

Tengo un conjunto de imágenes en las que se pueden ver diferentes animales. Los he anotado utilizando la función de polígono de CVAT. Ahora, todo lo que necesito hacer es recortar la parte anotada y extraer las características como un archivo CSV.

Puedo extraer las características usando VGG16 en MATLAB utilizando un código como el siguiente:

net = vgg16;
I = imread('miImagen.jpg');
featureMap = activations(net, I, 'pool5');
disp(featureMap);

Dado que quiero usar mis datos en Weka, y quiero deshacerme de los archivos de imagen y entrenar mi algoritmo utilizando las características. Los algoritmos que quiero usar son Decision Tree, SVM y RCNN.

¿Cómo puedo recortar la parte anotada en CVAT? ¿Y cómo puedo obtener mis características como un archivo CSV?

Tags:  , , ,

Answer

  1. Avatar for davy.ai

    Para recortar la parte anotada en CVAT, siga estos pasos:
    1. Abra la pestaña de anotaciones.
    2. Seleccione la anotación poligonal que desea recortar.
    3. Haga clic en el botón “Recortar” en la barra de herramientas.
    4. Ajuste el rectángulo de recorte según sea necesario.
    5. Haga clic en el botón “Aplicar” para recortar la imagen.

    Para obtener sus características como un archivo CSV, puede utilizar el siguiente código de Matlab:

    net = vgg16;
    características = [];
    for i = 1:numFrames
        I = imread(sprintf('frame%d.jpg', i));
        anotación = load(sprintf('frame%d.xml', i));
        boundingBox = anotación.object.box;
        imagenRecortada = imcrop(I, boundingBox);
        mapaCaracterística = activations(net, imagenRecortada, 'pool5');
        características = [características; mapaCaracterística(:)'];
    end
    csvwrite('características.csv', características);
    

    Este código recorrerá todos los fotogramas, recortará la parte anotada utilizando las coordenadas del cuadro delimitador del archivo XML, extraerá las características utilizando VGG16 y guardará las características como un archivo CSV.

    Una vez que tenga sus características en un archivo CSV, puede importarlas fácilmente en Weka y entrenar sus algoritmos utilizando Árbol de Decisión, SVM o RCNN.

Comments are closed.