es.davy.ai

Preguntas y respuestas de programación confiables

¿Tienes una pregunta?

Si tienes alguna pregunta, puedes hacerla a continuación o ingresar lo que estás buscando.

Aplanamiento de matrices de imágenes para Aprendizaje Profundo.

Tengo una pregunta sobre cómo aplanar las matrices de imágenes en este caso (64 x 64 pix x 3) a un vector (12288 x 1).

Entiendo que cada píxel de la imagen está en una matriz (64 x 64), y si entiendo correctamente, cada elemento de esta matriz es un vector de longitud 3 que contiene los datos R, G, B para ese único píxel. Entonces, la primera fila siguiente son los valores R, G, B para el píxel superior izquierdo:

train_set[0]

array([[[17, 31, 56],
[22, 33, 59],
[25, 35, 62],

Mi pregunta comienza aquí:

Cuando aplanamos los datos de la primera imagen (en un conjunto de datos de cientos de muestras), usando el siguiente código:

train_set_flatten = train_set.reshape(train_set.shape[0], -1).T

los primeros 3 elementos de train_set_flatten son los datos R, G, B para el primer píxel:

train_set_flatten[:,0][0:10]
array([17, 31, 56, 22, 33, 59, 25, 35, 62, 25], dtype=uint8)

Pero en algunos libros de texto, suponemos que primero se enumeran todos los elementos de la “matriz R”, luego “G” y luego “B”, pero lo que tengo ahora no está en este orden, ¿es correcto mi vector o necesito encontrar otra forma de aplanar la matriz?

Por favor, consulta las instrucciones de Neural Networks and Deep Learning de DeepLearning.AI en coursera.org: imagen enlace a la instrucción

Tags:  , ,

Answer

  1. Avatar for davy.ai

    Tu vector es correcto. El orden de los elementos no es importante siempre y cuando se mantenga consistente en todo el conjunto de datos. En este caso, el orden es R, G, B para cada píxel y el vector aplanado preserva este orden. Lo importante es asegurarse de que el vector aplanado pueda ser reconstruido de nuevo en las dimensiones originales de la matriz de la imagen si es necesario.

Comments are closed.