self-replicating-neural-net.../sanity_check_weights.py

from collections import defaultdict

from tqdm import tqdm
import pandas as pd
from pathlib import Path
import torch
import torch.nn as nn
from torch.nn import Flatten
from torch.utils.data import Dataset, DataLoader
from torchvision.datasets import MNIST, CIFAR10
from torchvision.transforms import ToTensor, Compose, Resize, Normalize, Grayscale
import torchmetrics

from functionalities_test import epsilon_error_margin as e
from network import MetaNet, MetaNetCompareBaseline


def extract_weights_from_model(model: MetaNet) -> dict:
    inpt = torch.zeros(5, device=next(model.parameters()).device, dtype=torch.float)
    inpt[-1] = 1

    weights = defaultdict(list)
    layers = [layer.particles for layer in model.all_layers]
    for i, layer in enumerate(layers):
        for net in layer:
            weights[i].append(net(inpt).detach())
    return dict(weights)


def test_weights_as_model(meta_net, new_weights, data, metric_class=torchmetrics.Accuracy):
    meta_net_device = next(meta_net.parameters()).device
    transfer_net = MetaNetCompareBaseline(meta_net.interface, depth=meta_net.depth,
                                          width=meta_net.width, out=meta_net.out,
                                          residual_skip=meta_net.residual_skip).to(meta_net_device)
    with torch.no_grad():
        new_weight_values = list(new_weights.values())
        old_parameters = list(transfer_net.parameters())
        assert len(new_weight_values) == len(old_parameters)
        for weights, parameters in zip(new_weights.values(), transfer_net.parameters()):
            parameters[:] = torch.Tensor(weights).view(parameters.shape)[:]

    transfer_net.eval()
    results = dict()
    for net in [meta_net, transfer_net]:
        net.eval()
        metric = metric_class()
        for batch, (batch_x, batch_y) in tqdm(enumerate(data), total=len(data), desc='Test Batch: '):
            y = net(batch_x.to(meta_net_device))
            metric(y.cpu(), batch_y.cpu())

        # metric on all batches using custom accumulation
        measure = metric.compute()
        results[net.__class__.__name__] = measure.item()
    return results


if __name__ == '__main__':
    DEVICE = torch.device('cuda' if torch.cuda.is_available() else 'cpu')
    WORKER = 0
    BATCHSIZE = 500
    MNIST_TRANSFORM = Compose([Resize((15, 15)), ToTensor(), Flatten(start_dim=0)])
    torch.manual_seed(42)
    data_path = Path('data')
    data_path.mkdir(exist_ok=True, parents=True)
    mnist_test = MNIST(str(data_path), transform=MNIST_TRANSFORM, download=True, train=False)
    d_test = DataLoader(mnist_test, batch_size=BATCHSIZE, shuffle=False, drop_last=True, num_workers=WORKER)

    model = torch.load(Path('experiments/output/trained_model_ckpt_e50.tp'), map_location=DEVICE).eval()
    weights = extract_weights_from_model(model)
    test_weights_as_model(model, weights, d_test)