Excepción encontrada al llamar la capa “peso_de_atención” (tipo Atención)

18 Jun, 2023 Programación 0

Soy un traductor de documentos de TI que traduce al español. Traduzca lo siguiente al español. No traduzca el código y la salida en markdown.

Soy nuevo en el uso de “atención”. Mi forma de entrada por muestra es de forma (6,128). No logro entender cuál podría ser la solución.

El código de error se presenta a continuación. Por favor ayúdame a resolver el problema. Sólo un poco de información adicional. Estoy tratando de agregar la capa de atención a un mapa de características concatenando las características de un modelo CNN y un modelo LSTM.

“`
Valor de error Rastro de pila (traceback) más reciente.
<ipython-input-20-ddc4e6d2fec2> en <module>()
—-> 1 model = MLSTMFCN((Xtrain.shape[1], Xtrain.shape[2]), trainlabel.shape[1])

2 frames
<ipython-input-19-ac6ce541a216> in MLSTMFCN(shape, numclasses)
19 y = GlobalAveragePooling1D()(y)
20 x = concatenate([x,y])
—> 21 x = keras.layers.Attention(name='attention_weight')(x)
22 out = Dense(numclasses, activation='softmax')(x)
23 model = Model(ip, out)

/usr/local/lib/python3.7/dist-packages/keras/utils/tracebackutils.py in errorhandler(args, **kwargs)
65 except Exception as e: # pylint: disable=broad-except
66 filteredtb = _processtracebackframes(e.traceback)
—> 67 raise e.withtraceback(filteredtb) from None
68 finally:
69 del filteredtb

/usr/local/lib/python3.7/dist-packages/keras/layers/denseattention.py in _validatecallargs(self, inputs, mask)
186 if not isinstance(inputs, list):
187 raise ValueError(
–> 188 f'{classname} layer must be called on a list of inputs, '
189 'namely [query, value] or [query, value, key]. '
190 f'Received: {inputs}.')

Valor de error: Se encontró una excepción al llamar a la capa "attention_weight" (tipo Atención).

La capa Atención debe ser llamada en una lista de entradas, es decir, [query, value] o [query, value, key]. Recibido: Tensor("Placeholder:0", shape=(None, 520), dtype=float32).

Argumentos de llamada recibidos:
• inputs=tf.Tensor(shape=(None, 520), dtype=float32)
• mask=None
• training=None
• returnattentionscores=False
“`

from keras.layers import Lambda def MLSTM_FCN(shape, num_classes): x = Input(shape=(6, 128)) ip = x x = Masking()(ip) x = LSTM(units=8)(x) x = Dropout(0.8)(x) y = Permute((2, 1))(ip) y = Conv1D(32, 3, padding='same', kernel_initializer='he_uniform')(y) y = BatchNormalization()(y) y = Activation('relu')(y) y = squeeze_excite_block(y) y = Conv1D(512, 3, padding='same', kernel_initializer='he_uniform')(y) y = BatchNormalization()(y) y = Activation('relu')(y) y = squeeze_excite_block(y) y = Conv1D(512, 9, padding='same', kernel_initializer='he_uniform')(y) y = BatchNormalization()(y) y = Activation('relu')(y) y = GlobalAveragePooling1D()(y) x = concatenate([x,y]) x = Lambda(lambda x: [x[:,:8], x[:,8:]])(x) # dividir en dos tensores x = keras.layers.Attention(name='attention_weight')(x) x = Flatten()(x) out = Dense(num_classes, activation='softmax')(x) model = Model(ip, out) model.compile(optimizer="adam", loss="categorical_crossentropy",metrics=['accuracy','AUC','Recall']) model.summary() return model

Answer

davy.ai

June 18, 2023 at 3:07 pm
El error sugiere que la capa de atención debe ser invocada en una lista de entradas, específicamente [query, value] o [query, value, key], pero que se está invocando en un solo tensor. Esto se debe a que concatenamos la salida de las capas LSTM y CNN antes de pasarla a la capa de atención, y esta última espera dos entradas separadas.

Para resolver este error, necesitamos separar el tensor concatenado en dos tensores separados antes de pasarlos a la capa de atención. Podemos hacer esto utilizando la capa Lambda de Keras junto con operaciones de slicing. Aquí está el código modificado:
```
from keras.layers import Lambda

def MLSTM_FCN(shape, num_classes):
    x = Input(shape=(6, 128))
    ip = x
    x = Masking()(ip)
    x = LSTM(units=8)(x)
    x = Dropout(0.8)(x)
    y = Permute((2, 1))(ip)
    y = Conv1D(32, 3, padding='same', kernel_initializer='he_uniform')(y)
    y = BatchNormalization()(y)
    y = Activation('relu')(y)
    y = squeeze_excite_block(y)
    y = Conv1D(512, 3, padding='same', kernel_initializer='he_uniform')(y)
    y = BatchNormalization()(y)
    y = Activation('relu')(y)
    y = squeeze_excite_block(y)
    y = Conv1D(512, 9, padding='same', kernel_initializer='he_uniform')(y)
    y = BatchNormalization()(y)
    y = Activation('relu')(y)
    y = GlobalAveragePooling1D()(y)
    x = concatenate([x,y])
    x = Lambda(lambda x: [x[:,:8], x[:,8:]])(x) # dividir en dos tensores
    x = keras.layers.Attention(name='attention_weight')(x)
    x = Flatten()(x)
    out = Dense(num_classes, activation='softmax')(x)
    model = Model(ip, out)
    model.compile(optimizer="adam", loss="categorical_crossentropy",metrics=['accuracy','AUC','Recall'])
    model.summary()

    return model
```
Utilizamos la capa Lambda con una función lambda para dividir el tensor concatenado en dos tensores, siendo el primer tensor la salida de la capa LSTM y el segundo tensor la salida de la capa CNN. Luego pasamos estos dos tensores a la capa de atención utilizando una lista. Finalmente, aplanamos el tensor de salida de la capa de atención antes de pasarlo a la capa Dense de salida.

Comments are closed.

es.davy.ai

¿Tienes una pregunta?

Excepción encontrada al llamar la capa “peso_de_atención” (tipo Atención)

Answer

davy.ai