Cómo usar conv2d en este caso

davy.ai

July 26, 2023 at 5:00 pm

No, Conv2d puede no ser adecuado para esta tarea ya que está más destinado a tareas de procesamiento de imágenes donde las entradas son matrices 2D.

Una posible solución para este problema podría ser usar una capa personalizada de PyTorch.

La capa podría tomar una entrada de tamaño (tamaño_del_lote, 100) y volverla a dar forma a (tamaño_del_lote, 20, 5). Luego, podríamos aplicar una transformación lineal en la última dimensión de la entrada remodelada para producir una salida de tamaño (tamaño_del_lote, 20, 3). Por último, podríamos aplanar la salida para obtener una salida de tamaño (tamaño_del_lote, 20*3).

El código para esta capa podría ser algo así:

import torch.nn as nn

class CapaPersonalizada(nn.Module):
    def __init__(self):
        super().__init__()
        self.lineal = nn.Linear(5, 3)

    def forward(self, x):
        x = x.view(-1, 20, 5)
        x = self.lineal(x)
        x = x.view(-1, 20*3)
        return x

Aquí definimos una capa personalizada CapaPersonalizada, que toma una entrada x y aplica la transformación lineal a cada bloque de tamaño 5.

Para usar esta capa, la instanciaríamos y la agregaríamos a nuestra red neuronal como cualquier otra capa de PyTorch:

modelo = nn.Sequential(
    nn.Linear(100, 200),
    nn.ReLU(),
    CapaPersonalizada(),
    nn.Linear(20*3, 10),
    nn.Softmax(dim=1)
)

En este ejemplo, tenemos una red neuronal con una capa oculta de tamaño 200, seguida de nuestra capa personalizada, otra capa lineal para producir nuestra salida final y una activación softmax.

Cabe destacar que el tamaño de entrada de 100 y el tamaño de salida de 20*3 están tenidos en cuenta en la capa personalizada, por lo que no necesitamos especificar estos valores explícitamente al definir la arquitectura de nuestra red neuronal.

Answer

davy.ai

July 26, 2023 at 5:00 pm
No, Conv2d puede no ser adecuado para esta tarea ya que está más destinado a tareas de procesamiento de imágenes donde las entradas son matrices 2D.

Una posible solución para este problema podría ser usar una capa personalizada de PyTorch.

La capa podría tomar una entrada de tamaño (tamaño_del_lote, 100) y volverla a dar forma a (tamaño_del_lote, 20, 5). Luego, podríamos aplicar una transformación lineal en la última dimensión de la entrada remodelada para producir una salida de tamaño (tamaño_del_lote, 20, 3). Por último, podríamos aplanar la salida para obtener una salida de tamaño (tamaño_del_lote, 20*3).

El código para esta capa podría ser algo así:
```
import torch.nn as nn

class CapaPersonalizada(nn.Module):
    def __init__(self):
        super().__init__()
        self.lineal = nn.Linear(5, 3)

    def forward(self, x):
        x = x.view(-1, 20, 5)
        x = self.lineal(x)
        x = x.view(-1, 20*3)
        return x
```
Aquí definimos una capa personalizada CapaPersonalizada, que toma una entrada x y aplica la transformación lineal a cada bloque de tamaño 5.

Para usar esta capa, la instanciaríamos y la agregaríamos a nuestra red neuronal como cualquier otra capa de PyTorch:
```
modelo = nn.Sequential(
    nn.Linear(100, 200),
    nn.ReLU(),
    CapaPersonalizada(),
    nn.Linear(20*3, 10),
    nn.Softmax(dim=1)
)
```
En este ejemplo, tenemos una red neuronal con una capa oculta de tamaño 200, seguida de nuestra capa personalizada, otra capa lineal para producir nuestra salida final y una activación softmax.

Cabe destacar que el tamaño de entrada de 100 y el tamaño de salida de 20*3 están tenidos en cuenta en la capa personalizada, por lo que no necesitamos especificar estos valores explícitamente al definir la arquitectura de nuestra red neuronal.

Comments are closed.

es.davy.ai

¿Tienes una pregunta?

Cómo usar conv2d en este caso

Answer

davy.ai