PyTorch: omitir el cálculo de características de modelos preentrenados en cada época.

davy.ai

July 12, 2023 at 3:48 pm

En Pytorch, es una práctica común entrenar solamente la capa de clasificación de un modelo pre-entrenado para el aprendizaje por transferencia. Una forma de evitar el cálculo repetido de la extracción de características en cada época es extraer las características una vez y guardarlas para su uso posterior. Esto se puede lograr utilizando DataLoader y torch.utils.data.Dataset de Pytorch. Aquí tienes un código de ejemplo:

from torch.utils.data import DataLoader, Dataset
from torchvision import transforms, models
import torch.nn as nn
import torch.optim as optim
import torch

class FeaturesDataset(Dataset):
    def __init__(self, dataset, model):
        self.dataset = dataset
        self.model = model

    def __getitem__(self, index):
        x = self.dataset[index][0]
        x = self.model(x.unsqueeze(0))
        return x.squeeze(0)

    def __len__(self):
        return len(self.dataset)

# Cargar el modelo pre-entrenado
pretrained_model = models.resnet18(pretrained=True)
pretrained_model.fc = nn.Identity()

# Crear extractor de características
feature_extractor = nn.Sequential(
    pretrained_model,
    nn.Flatten(),
)

# Extraer características del conjunto de datos de entrenamiento solo una vez
transform = transforms.Compose([
    transforms.Resize(256),
    transforms.CenterCrop(224),
    transforms.ToTensor(),
    transforms.Normalize(
        mean=[0.485, 0.456, 0.406],
        std=[0.229, 0.224, 0.225]
    ),
])

dataset = torchvision.datasets.ImageFolder('path/to/data', transform=transform)
loader = DataLoader(dataset, batch_size=16, num_workers=4)

features = []
with torch.no_grad():
    for batch in loader:
        features.append(feature_extractor(batch))
features_x = torch.cat(features)

# Guardar características para uso posterior
torch.save(features_x, 'features.pt')

# Crear un modelo y agregar capas
model = nn.Sequential(
    nn.Linear(512, 100),
    nn.ReLU(),
    nn.Linear(100, Y.shape[1]),
    nn.Softmax(dim=1),
)

# Cargar características pre-extraídas
features_x = torch.load('features.pt')

# Compilar y entrenar solamente las capas completamente conectadas del modelo
criterion = nn.CrossEntropyLoss()
optimizer = optim.Adam(model.parameters(), lr=0.001)

for epoch in range(Epochs):
    for x, y in zip(features_x, Y_train):
        optimizer.zero_grad()
        output = model(x)
        loss = criterion(output, y)
        loss.backward()
        optimizer.step()

En este ejemplo, creamos un conjunto de datos y un DataLoader de Pytorch para cargar y preprocesar los datos, y un FeaturesDataset para extraer características del modelo pre-entrenado. Luego, iteramos sobre el DataLoader para extraer las características una vez y guardarlas en un archivo. Después de eso, creamos un modelo de Pytorch y cargamos las características pre-extraídas, y entrenamos solo las capas completamente conectadas del modelo.

es.davy.ai

¿Tienes una pregunta?

PyTorch: omitir el cálculo de características de modelos preentrenados en cada época.

Answer

davy.ai