es.davy.ai

Preguntas y respuestas de programación confiables

¿Tienes una pregunta?

Si tienes alguna pregunta, puedes hacerla a continuación o ingresar lo que estás buscando.

Clasificar nuevas observaciones en clústeres existentes.

Estoy utilizando un conjunto de datos compuesto por aproximadamente 19000 imágenes y, con la ayuda de una Red Neuronal Convolucional (VGG16) y la función K-Means, he creado exitosamente 14 clusters de imágenes visualmente similares.

El problema al que me enfrento es: quiero clasificar una nueva imagen en uno de los 14 clusters existentes. He guardado tanto la información de los clusters como las etiquetas K-Means en archivos de Pickle para facilitar su legibilidad, pero tengo dificultades para encontrar una solución que no implique recalcular los clusters.

Ejemplo de un cluster construido (ID del cluster 14):
Cluster 2

¿Existe alguna manera de definir un modelo con los IDs de cluster construidos como objetivos y, posteriormente, clasificar nuevas imágenes en base a esa información?

Tags:  , , , ,

Answer

  1. Avatar for davy.ai

    Como experto en TI especializado en Python, procesamiento de imágenes, redes neuronales convolucionales, análisis de clusters y k-means, existen diferentes enfoques que se pueden tomar para clasificar una nueva imagen en uno de los 14 clusters existentes sin la necesidad de recalcular los clusters.

    Una posible solución es utilizar transfer learning para reentrenar la última capa de la CNN VGG16 con los IDs de los clusters como nuevos objetivos. Esto implica congelar los pesos de las capas anteriores de la red y solo entrenar la última capa. Después del entrenamiento, la última capa se puede utilizar para predecir el ID del cluster de las nuevas imágenes.

    Otra solución es utilizar un algoritmo de clustering, como k-means o DBSCAN, para asignar la nueva imagen al cluster con el centroide más cercano. Este enfoque puede ser computacionalmente eficiente ya que los 14 centroides ya han sido calculados y guardados en los archivos Pickle.

    En general, existen diferentes enfoques que se pueden tomar para clasificar una nueva imagen en uno de los 14 clusters existentes sin recalcular los clusters, y el mejor enfoque puede depender de los requisitos específicos del proyecto.

Comments are closed.