From 714e07a816d08577c374854d7505dbf92980693c Mon Sep 17 00:00:00 2001
From: Steffen Illium <steffen.illium@ifi.lmu.de>
Date: Fri, 1 Sep 2023 13:04:54 +0200
Subject: [PATCH] New Szenario "Two_Rooms_One_Door"

---
 marl_factory_grid/configs/default_config.yaml |   5 -
 .../configs/two_rooms_one_door.yaml           |  53 +++---
 .../environment/entity/object.py              |   8 +-
 marl_factory_grid/environment/factory.py      |  39 ++---
 .../environment/groups/env_objects.py         |   3 -
 .../environment/groups/mixins.py              |   3 +-
 .../environment/groups/objects.py             |   8 +-
 marl_factory_grid/environment/groups/utils.py |  35 ----
 .../environment/groups/wall_n_floors.py       |   6 +
 marl_factory_grid/logging/recorder.py         | 152 -----------------
 .../modules/batteries/__init__.py             |   2 +-
 .../modules/batteries/constants.py            |   9 -
 .../modules/batteries/entitites.py            |  17 +-
 marl_factory_grid/modules/batteries/groups.py |   5 +-
 marl_factory_grid/modules/batteries/rules.py  |  16 ++
 .../modules/destinations/entitites.py         |   2 +-
 marl_factory_grid/modules/items/actions.py    |   3 +-
 marl_factory_grid/modules/items/groups.py     |   2 +-
 marl_factory_grid/quickstart.py               |   1 +
 marl_factory_grid/utils/config_parser.py      |   1 -
 .../{ => utils}/logging/__init__.py           |   0
 .../{ => utils}/logging/envmonitor.py         |  11 +-
 marl_factory_grid/utils/logging/recorder.py   | 160 ++++++++++++++++++
 .../{ => utils}/plotting/__init__.py          |   0
 .../{ => utils}/plotting/compare_runs.py      |   2 +-
 .../{ => utils}/plotting/plotting.py          |   0
 marl_factory_grid/utils/proto/__init__.py     |   0
 marl_factory_grid/utils/tools.py              |   1 +
 reload_agent.py                               |   4 +-
 29 files changed, 271 insertions(+), 277 deletions(-)
 delete mode 100644 marl_factory_grid/logging/recorder.py
 rename marl_factory_grid/{ => utils}/logging/__init__.py (100%)
 rename marl_factory_grid/{ => utils}/logging/envmonitor.py (81%)
 create mode 100644 marl_factory_grid/utils/logging/recorder.py
 rename marl_factory_grid/{ => utils}/plotting/__init__.py (100%)
 rename marl_factory_grid/{ => utils}/plotting/compare_runs.py (99%)
 rename marl_factory_grid/{ => utils}/plotting/plotting.py (100%)
 create mode 100644 marl_factory_grid/utils/proto/__init__.py

diff --git a/marl_factory_grid/configs/default_config.yaml b/marl_factory_grid/configs/default_config.yaml
index 6bc6f6c..42bd352 100644
--- a/marl_factory_grid/configs/default_config.yaml
+++ b/marl_factory_grid/configs/default_config.yaml
@@ -21,7 +21,6 @@ Agents:
     - Items
     - Inventory
     - DropOffLocations
-    - Machines
     - Maintainers
 Entities:
   Batteries: {}
@@ -79,10 +78,6 @@ Rules:
     n_items: 5
     n_locations: 5
     spawn_frequency: 15
-  MachineRule:
-    n_machines: 2
-  MaintenanceRule:
-    n_maintainer: 1
   MaxStepsReached:
     max_steps: 500
 #  AgentSingleZonePlacement:
diff --git a/marl_factory_grid/configs/two_rooms_one_door.yaml b/marl_factory_grid/configs/two_rooms_one_door.yaml
index 7bc3cef..ae095e4 100644
--- a/marl_factory_grid/configs/two_rooms_one_door.yaml
+++ b/marl_factory_grid/configs/two_rooms_one_door.yaml
@@ -1,3 +1,31 @@
+General:
+  env_seed: 69
+  individual_rewards: true
+  level_name: two_rooms
+  pomdp_r: 3
+  verbose: false
+
+Entities:
+  BoundDestinations: {}
+  ReachedDestinations: {}
+  Doors: {}
+  GlobalPositions: {}
+  Zones: {}
+
+Rules:
+  # Init:
+  AssignGlobalPositions: {}
+  ZoneInit: {}
+  AgentSingleZonePlacement: {}
+  IndividualDestinationZonePlacement: {}
+  # Env Rules
+  MaxStepsReached:
+    max_steps: 10
+  Collision:
+    done_at_collisions: false
+  DoorAutoClose:
+    close_frequency: 10
+
 Agents:
   Wolfgang:
     Actions:
@@ -21,27 +49,4 @@ Agents:
       - Other
       - Walls
       - BoundDestination
-      - Doors
-Entities:
-  BoundDestinations: {}
-  ReachedDestinations: {}
-  Doors: {}
-  GlobalPositions: {}
-  Zones: {}
-
-General:
-  env_seed: 69
-  individual_rewards: true
-  level_name: two_rooms
-  pomdp_r: 3
-  verbose: false
-
-Rules:
-  Collision:
-    done_at_collisions: false
-  AssignGlobalPositions: {}
-  DoorAutoClose:
-    close_frequency: 10
-  ZoneInit: {}
-  AgentSingleZonePlacement: {}
-  IndividualDestinationZonePlacement: {}
+      - Doors
\ No newline at end of file
diff --git a/marl_factory_grid/environment/entity/object.py b/marl_factory_grid/environment/entity/object.py
index c546567..2de33cd 100644
--- a/marl_factory_grid/environment/entity/object.py
+++ b/marl_factory_grid/environment/entity/object.py
@@ -62,11 +62,14 @@ class Object:
 
     def add_observer(self, observer):
         self.observers.append(observer)
-        observer.notify_change_pos(self)
+        observer.notify_add_entity(self)
 
     def del_observer(self, observer):
         self.observers.remove(observer)
 
+    def summarize_state(self):
+        return dict()
+
 
 class EnvObject(Object):
 
@@ -128,3 +131,6 @@ class EnvObject(Object):
         self._collection.delete_env_object(self)
         self._collection = other_collection
         return self._collection == other_collection
+
+    def summarize_state(self):
+        return dict(name=str(self.name))
diff --git a/marl_factory_grid/environment/factory.py b/marl_factory_grid/environment/factory.py
index 89ba3e2..627351a 100644
--- a/marl_factory_grid/environment/factory.py
+++ b/marl_factory_grid/environment/factory.py
@@ -16,8 +16,6 @@ import marl_factory_grid.environment.constants as c
 
 from marl_factory_grid.utils.states import Gamestate
 
-REC_TAC = 'rec_'
-
 
 class Factory(gym.Env):
 
@@ -44,11 +42,6 @@ class Factory(gym.Env):
         config_dict = yaml.safe_load(config_path.open())
         return config_dict
 
-    @property
-    def summarize_header(self):
-        summary_dict = self._summarize_state(stateless_entities=True)
-        return summary_dict
-
     def __exit__(self, exc_type, exc_val, exc_tb):
         self.close()
 
@@ -125,9 +118,6 @@ class Factory(gym.Env):
         info = reward_info
 
         info.update(step_reward=sum(reward), step=self.state.curr_step)
-        # TODO:
-        #  if self._record_episodes:
-        #      info.update(self._summarize_state())
 
         obs, reset_info = self.obs_builder.refresh_and_build_for_all(self.state)
         info.update(reset_info)
@@ -171,14 +161,6 @@ class Factory(gym.Env):
             self.state.print(f"reward is {reward}")
         return reward, combined_info_dict, done
 
-    def start_recording(self):
-        self.conf.do_record = True
-        return self.conf.do_record
-
-    def stop_recording(self):
-        self.conf.do_record = False
-        return not self.conf.do_record
-
     # noinspection PyGlobalUndefined
     def render(self, mode='human'):
         if not self._renderer:  # lazy init
@@ -193,12 +175,23 @@ class Factory(gym.Env):
                     render_entity.aux = self.obs_builder.curr_lightmaps[render_entity.real_name]
         return self._renderer.render(render_entities)
 
-    def _summarize_state(self, stateless_entities=False):
-        summary = {f'{REC_TAC}step': self.state.curr_step}
+    def summarize_header(self):
+        header = {'rec_step': self.state.curr_step}
+        for entity_group in (x for x in self.state if x.name in ['Walls', 'Floors', 'DropOffLocations', 'ChargePods']):
+            header.update({f'rec{entity_group.name}': entity_group.summarize_states()})
+        return header
 
-        for entity_group in self.state:
-            if entity_group.is_stateless == stateless_entities:
-                summary.update({f'{REC_TAC}{entity_group.name}': entity_group.summarize_states()})
+    def summarize_state(self):
+        summary = {'step': self.state.curr_step}
+
+        # Todo: Protobuff Compatibility Section                                      #######
+        #  for entity_group in (x for x in self.state if x.name not in [c.WALLS, c.FLOORS]):
+        for entity_group in (x for x in self.state if x.name not in [c.FLOORS]):
+            summary.update({entity_group.name.lower(): entity_group.summarize_states()})
+        # TODO Section End                                                          ########
+        for key in list(summary.keys()):
+            if key not in ['step', 'walls', 'doors', 'agents', 'items', 'dirtPiles', 'batteries']:
+                del summary[key]
         return summary
 
     def print(self, string):
diff --git a/marl_factory_grid/environment/groups/env_objects.py b/marl_factory_grid/environment/groups/env_objects.py
index b3efb2b..dcbcd26 100644
--- a/marl_factory_grid/environment/groups/env_objects.py
+++ b/marl_factory_grid/environment/groups/env_objects.py
@@ -23,9 +23,6 @@ class EnvObjects(Objects):
         super(EnvObjects, self).add_item(item)
         return self
 
-    def summarize_states(self):
-        return [entity.summarize_state() for entity in self.values()]
-
     def delete_env_object(self, env_object: EnvObject):
         del self[env_object.name]
 
diff --git a/marl_factory_grid/environment/groups/mixins.py b/marl_factory_grid/environment/groups/mixins.py
index 8bf47e3..88d2841 100644
--- a/marl_factory_grid/environment/groups/mixins.py
+++ b/marl_factory_grid/environment/groups/mixins.py
@@ -45,7 +45,8 @@ class PositionMixin:
     def by_pos(self, pos: (int, int)):
         pos = tuple(pos)
         try:
-            return next(e for e in self if e.pos == pos)
+            return self.pos_dict[pos]
+            # return next(e for e in self if e.pos == pos)
         except StopIteration:
             pass
         except ValueError:
diff --git a/marl_factory_grid/environment/groups/objects.py b/marl_factory_grid/environment/groups/objects.py
index 7e8e542..3771439 100644
--- a/marl_factory_grid/environment/groups/objects.py
+++ b/marl_factory_grid/environment/groups/objects.py
@@ -144,7 +144,13 @@ class Objects:
 
     def notify_add_entity(self, entity: Object):
         try:
-            entity.add_observer(self)
+            if self not in entity.observers:
+                entity.add_observer(self)
             self.pos_dict[entity.pos].append(entity)
         except (ValueError, AttributeError):
             pass
+
+    def summarize_states(self):
+        # FIXME PROTOBUFF
+        #  return [e.summarize_state() for e in self]
+        return [e.summarize_state() for e in self]
diff --git a/marl_factory_grid/environment/groups/utils.py b/marl_factory_grid/environment/groups/utils.py
index 49138cd..a3f90b0 100644
--- a/marl_factory_grid/environment/groups/utils.py
+++ b/marl_factory_grid/environment/groups/utils.py
@@ -43,38 +43,3 @@ class GlobalPositions(HasBoundMixin, EnvObjects):
 
     def __init__(self, *args, **kwargs):
         super(GlobalPositions, self).__init__(*args, **kwargs)
-
-
-class ZonesOLD(Objects):
-
-    _entity = Zone
-
-    @property
-    def accounting_zones(self):
-        return [self[idx] for idx, name in self.items() if name != c.DANGER_ZONE]
-
-    def __init__(self, parsed_level):
-        raise NotImplementedError('This needs a Rework')
-        super(Zones, self).__init__()
-        slices = list()
-        self._accounting_zones = list()
-        self._danger_zones = list()
-        for symbol in np.unique(parsed_level):
-            if symbol == c.VALUE_OCCUPIED_CELL:
-                continue
-            elif symbol == c.DANGER_ZONE:
-                self + symbol
-                slices.append(h.one_hot_level(parsed_level, symbol))
-                self._danger_zones.append(symbol)
-            else:
-                self + symbol
-                slices.append(h.one_hot_level(parsed_level, symbol))
-                self._accounting_zones.append(symbol)
-
-        self._zone_slices = np.stack(slices)
-
-    def __getitem__(self, item):
-        return self._zone_slices[item]
-
-    def add_items(self, other: Union[str, List[str]]):
-        raise AttributeError('You are not allowed to add additional Zones in runtime.')
diff --git a/marl_factory_grid/environment/groups/wall_n_floors.py b/marl_factory_grid/environment/groups/wall_n_floors.py
index 6acf898..8348a61 100644
--- a/marl_factory_grid/environment/groups/wall_n_floors.py
+++ b/marl_factory_grid/environment/groups/wall_n_floors.py
@@ -26,6 +26,12 @@ class Walls(PositionMixin, EnvObjects):
     def from_tiles(cls, tiles, *args, **kwargs):
         raise RuntimeError()
 
+    def by_pos(self, pos: (int, int)):
+        try:
+            return super().by_pos(pos)[0]
+        except IndexError:
+            return None
+
 
 class Floors(Walls):
     _entity = Floor
diff --git a/marl_factory_grid/logging/recorder.py b/marl_factory_grid/logging/recorder.py
deleted file mode 100644
index 209d912..0000000
--- a/marl_factory_grid/logging/recorder.py
+++ /dev/null
@@ -1,152 +0,0 @@
-import warnings
-from collections import defaultdict
-from os import PathLike
-from pathlib import Path
-from typing import Union
-
-import yaml
-from gymnasium import Wrapper
-
-import numpy as np
-import pandas as pd
-
-from marl_factory_grid.environment.factory import REC_TAC
-
-
-class EnvRecorder(Wrapper):
-
-    def __init__(self, env, entities: str = 'all', filepath: Union[str, PathLike] = None, freq: int = 0):
-        super(EnvRecorder, self).__init__(env)
-        self.filepath = filepath
-        self.freq = freq
-        self._recorder_dict = defaultdict(list)
-        self._recorder_out_list = list()
-        self._episode_counter = 1
-        self._do_record_dict = defaultdict(lambda: False)
-        if isinstance(entities, str):
-            if entities.lower() == 'all':
-                self._entities = None
-            else:
-                self._entities = [entities]
-        else:
-            self._entities = entities
-
-    def __getattr__(self, item):
-        return getattr(self.unwrapped, item)
-
-    def reset(self):
-        self._on_training_start()
-        return self.unwrapped.reset()
-
-    def _on_training_start(self) -> None:
-        assert self.start_recording()
-
-    def _read_info(self, env_idx, info: dict):
-        if info_dict := {key.replace(REC_TAC, ''): val for key, val in info.items() if key.startswith(f'{REC_TAC}')}:
-            if self._entities:
-                info_dict = {k: v for k, v in info_dict.items() if k in self._entities}
-            self._recorder_dict[env_idx].append(info_dict)
-        else:
-            pass
-        return True
-
-    def _read_done(self, env_idx, done):
-        if done:
-            self._recorder_out_list.append({'steps': self._recorder_dict[env_idx],
-                                            'episode': self._episode_counter})
-            self._recorder_dict[env_idx] = list()
-        else:
-            pass
-
-    def step(self, actions):
-        step_result = self.unwrapped.step(actions)
-        if self.do_record_episode(0):
-            info = step_result[-1]
-            self._read_info(0, info)
-        if self._do_record_dict[0]:
-            self._read_done(0, step_result[-2])
-        return step_result
-
-    def finalize(self):
-        self._on_training_end()
-        return True
-
-    def save_records(self, filepath: Union[Path, str, None] = None,
-                     only_deltas=True,
-                     save_occupation_map=False,
-                     save_trajectory_map=False,
-                     ):
-        filepath = Path(filepath or self.filepath)
-        filepath.parent.mkdir(exist_ok=True, parents=True)
-        # cls.out_file.unlink(missing_ok=True)
-        with filepath.open('w') as f:
-            if only_deltas:
-                from deepdiff import DeepDiff
-                diff_dict = [DeepDiff(t1,t2, ignore_order=True)
-                             for t1, t2 in zip(self._recorder_out_list, self._recorder_out_list[1:])
-                             ]
-                out_dict = {'episodes': diff_dict}
-
-            else:
-                out_dict = {'episodes': self._recorder_out_list}
-            out_dict.update(
-                {'n_episodes': self._episode_counter,
-                 'env_params': self.env.params,
-                 'header': self.env.summarize_header
-                 })
-            try:
-                yaml.dump(out_dict, f, indent=4)
-            except TypeError:
-                print('Shit')
-
-        if save_occupation_map:
-            a = np.zeros((15, 15))
-            # noinspection PyTypeChecker
-            for episode in out_dict['episodes']:
-                df = pd.DataFrame([y for x in episode['steps'] for y in x['Agents']])
-
-                b = list(df[['x', 'y']].to_records(index=False))
-
-                np.add.at(a, tuple(zip(*b)), 1)
-
-            # a = np.rot90(a)
-            import seaborn as sns
-            from matplotlib import pyplot as plt
-            hm = sns.heatmap(data=a)
-            hm.set_title('Very Nice Heatmap')
-            plt.show()
-
-        if save_trajectory_map:
-            raise NotImplementedError('This has not yet been implemented.')
-
-    def do_record_episode(self, env_idx):
-        if not self._recorder_dict[env_idx]:
-            if self.freq:
-                self._do_record_dict[env_idx] = (self.freq == -1) or (self._episode_counter % self.freq) == 0
-            else:
-                self._do_record_dict[env_idx] = False
-                warnings.warn('You did wrap your Environment with a recorder, but set the freq to zero\n'
-                              'Nothing will be recorded')
-            self._episode_counter += 1
-        else:
-            pass
-        return self._do_record_dict[env_idx]
-
-    def _on_step(self) -> bool:
-        for env_idx, info in enumerate(self.locals.get('infos', [])):
-            if self._do_record_dict[env_idx]:
-                self._read_info(env_idx, info)
-        dones = list(enumerate(self.locals.get('dones', [])))
-        dones.extend(list(enumerate(self.locals.get('done', []))))
-        for env_idx, done in dones:
-            if self._do_record_dict[env_idx]:
-                self._read_done(env_idx, done)
-
-        return True
-
-    def _on_training_end(self) -> None:
-        for env_idx in range(len(self._recorder_dict)):
-            if self._recorder_dict[env_idx]:
-                self._recorder_out_list.append({'steps': self._recorder_dict[env_idx],
-                                                'episode': self._episode_counter})
-        pass
diff --git a/marl_factory_grid/modules/batteries/__init__.py b/marl_factory_grid/modules/batteries/__init__.py
index 52e82d5..08d5626 100644
--- a/marl_factory_grid/modules/batteries/__init__.py
+++ b/marl_factory_grid/modules/batteries/__init__.py
@@ -1,4 +1,4 @@
 from .actions import BtryCharge
-from .entitites import ChargePod, Battery
+from .entitites import Pod, Battery
 from .groups import ChargePods, Batteries
 from .rules import BtryDoneAtDischarge, Btry
diff --git a/marl_factory_grid/modules/batteries/constants.py b/marl_factory_grid/modules/batteries/constants.py
index 7e32b5d..77bd920 100644
--- a/marl_factory_grid/modules/batteries/constants.py
+++ b/marl_factory_grid/modules/batteries/constants.py
@@ -8,12 +8,3 @@ CHARGE_POD_SYMBOL    = 1
 
 
 CHARGE              = 'do_charge_action'
-
-
-class BatteryProperties(NamedTuple):
-    initial_charge: float = 0.8             #
-    charge_rate: float = 0.4                #
-    charge_locations: int = 20               #
-    per_action_costs: Union[dict, float] = 0.02
-    done_when_discharged: bool = False
-    multi_charge: bool = False
diff --git a/marl_factory_grid/modules/batteries/entitites.py b/marl_factory_grid/modules/batteries/entitites.py
index a8977c4..9cf81d6 100644
--- a/marl_factory_grid/modules/batteries/entitites.py
+++ b/marl_factory_grid/modules/batteries/entitites.py
@@ -42,16 +42,16 @@ class Battery(BoundEntityMixin, EnvObject):
         else:
             return c.NOT_VALID
 
-    def summarize_state(self, **_):
-        attr_dict = {key: str(val) for key, val in self.__dict__.items() if not key.startswith('_') and key != 'data'}
-        attr_dict.update(dict(name=self.name, belongs_to=self._bound_entity.name))
-        return attr_dict
+    def summarize_state(self):
+        summary = super().summarize_state()
+        summary.update(dict(belongs_to=self._bound_entity.name, chargeLevel=self.charge_level))
+        return summary
 
     def render(self):
         return None
 
 
-class ChargePod(Entity):
+class Pod(Entity):
 
     @property
     def encoding(self):
@@ -59,7 +59,7 @@ class ChargePod(Entity):
 
     def __init__(self, *args, charge_rate: float = 0.4,
                  multi_charge: bool = False, **kwargs):
-        super(ChargePod, self).__init__(*args, **kwargs)
+        super(Pod, self).__init__(*args, **kwargs)
         self.charge_rate = charge_rate
         self.multi_charge = multi_charge
 
@@ -73,3 +73,8 @@ class ChargePod(Entity):
 
     def render(self):
         return RenderEntity(b.CHARGE_PODS, self.pos)
+
+    def summarize_state(self) -> dict:
+        summery = super().summarize_state()
+        summery.update(charge_rate=self.charge_rate)
+        return summery
diff --git a/marl_factory_grid/modules/batteries/groups.py b/marl_factory_grid/modules/batteries/groups.py
index 1eeb58e..ac51daf 100644
--- a/marl_factory_grid/modules/batteries/groups.py
+++ b/marl_factory_grid/modules/batteries/groups.py
@@ -1,6 +1,6 @@
 from marl_factory_grid.environment.groups.env_objects import EnvObjects
 from marl_factory_grid.environment.groups.mixins import PositionMixin, HasBoundMixin
-from marl_factory_grid.modules.batteries.entitites import ChargePod, Battery
+from marl_factory_grid.modules.batteries.entitites import Pod, Battery
 
 
 class Batteries(HasBoundMixin, EnvObjects):
@@ -20,9 +20,10 @@ class Batteries(HasBoundMixin, EnvObjects):
         batteries = [self._entity(initial_charge_level, agent) for _, agent in enumerate(agents)]
         self.add_items(batteries)
 
+
 class ChargePods(PositionMixin, EnvObjects):
 
-    _entity = ChargePod
+    _entity = Pod
 
     def __init__(self, *args, **kwargs):
         super(ChargePods, self).__init__(*args, **kwargs)
diff --git a/marl_factory_grid/modules/batteries/rules.py b/marl_factory_grid/modules/batteries/rules.py
index e8e7816..ffa6406 100644
--- a/marl_factory_grid/modules/batteries/rules.py
+++ b/marl_factory_grid/modules/batteries/rules.py
@@ -59,3 +59,19 @@ class BtryDoneAtDischarge(Rule):
         else:
             return [DoneResult(self.name, validity=c.NOT_VALID, reward=0)]
 
+
+class PodRules(Rule):
+
+    def __init__(self, n_pods: int, charge_rate: float = 0.4, multi_charge: bool = False):
+        super().__init__()
+        self.multi_charge = multi_charge
+        self.charge_rate = charge_rate
+        self.n_pods = n_pods
+
+    def on_init(self, state, lvl_map):
+        pod_collection = state[b.CHARGE_PODS]
+        empty_tiles = state[c.FLOOR].empty_tiles[:self.n_pods]
+        pods = pod_collection.from_tiles(empty_tiles, entity_kwargs=dict(
+            multi_charge=self.multi_charge, charge_rate=self.charge_rate)
+                                         )
+        pod_collection.add_items(pods)
diff --git a/marl_factory_grid/modules/destinations/entitites.py b/marl_factory_grid/modules/destinations/entitites.py
index a696877..7086ea9 100644
--- a/marl_factory_grid/modules/destinations/entitites.py
+++ b/marl_factory_grid/modules/destinations/entitites.py
@@ -51,7 +51,7 @@ class Destination(Entity):
     def summarize_state(self) -> dict:
         state_summary = super().summarize_state()
         state_summary.update(per_agent_times=[
-            dict(belongs_to=key, time=val) for key, val in self._per_agent_times.keys()], dwell_time=self.dwell_time)
+            dict(belongs_to=key, time=val) for key, val in self._per_agent_times.items()], dwell_time=self.dwell_time)
         return state_summary
 
     def render(self):
diff --git a/marl_factory_grid/modules/items/actions.py b/marl_factory_grid/modules/items/actions.py
index 16f2d72..d805310 100644
--- a/marl_factory_grid/modules/items/actions.py
+++ b/marl_factory_grid/modules/items/actions.py
@@ -26,7 +26,8 @@ class ItemAction(Action):
             reward = r.DROP_OFF_VALID if valid else r.DROP_OFF_FAIL
             return ActionResult(entity=entity, identifier=self._identifier, validity=valid, reward=reward)
 
-        elif item := state[i.ITEM].by_pos(entity.pos):
+        elif items := state[i.ITEM].by_pos(entity.pos):
+            item = items[0]
             item.change_parent_collection(inventory)
             item.set_tile_to(state.NO_POS_TILE)
             state.print(f'{entity.name} just picked up an item at {entity.pos}')
diff --git a/marl_factory_grid/modules/items/groups.py b/marl_factory_grid/modules/items/groups.py
index 8e45cd3..24a02b5 100644
--- a/marl_factory_grid/modules/items/groups.py
+++ b/marl_factory_grid/modules/items/groups.py
@@ -51,7 +51,7 @@ class Inventories(HasBoundMixin, Objects):
     _entity = Inventory
     var_can_move = False
 
-    def __init__(self, size, *args, **kwargs):
+    def __init__(self, size: int, *args, **kwargs):
         super(Inventories, self).__init__(*args, **kwargs)
         self.size = size
         self._obs = None
diff --git a/marl_factory_grid/quickstart.py b/marl_factory_grid/quickstart.py
index 7e44610..d07c3d9 100644
--- a/marl_factory_grid/quickstart.py
+++ b/marl_factory_grid/quickstart.py
@@ -17,3 +17,4 @@ def init():
     shutil.copytree(template_path, cwd)
     print(f'Templates copied to {cwd}"/"{template_path.name}')
     print(':wave:')
+
diff --git a/marl_factory_grid/utils/config_parser.py b/marl_factory_grid/utils/config_parser.py
index 9ac8234..9edae27 100644
--- a/marl_factory_grid/utils/config_parser.py
+++ b/marl_factory_grid/utils/config_parser.py
@@ -24,7 +24,6 @@ class FactoryConfigParser(object):
         self.config_path = Path(config_path)
         self.custom_modules_path = Path(custom_modules_path) if custom_modules_path is not None else custom_modules_path
         self.config = yaml.safe_load(self.config_path.open())
-        self.do_record = False
 
     def __getattr__(self, item):
         return self['General'][item]
diff --git a/marl_factory_grid/logging/__init__.py b/marl_factory_grid/utils/logging/__init__.py
similarity index 100%
rename from marl_factory_grid/logging/__init__.py
rename to marl_factory_grid/utils/logging/__init__.py
diff --git a/marl_factory_grid/logging/envmonitor.py b/marl_factory_grid/utils/logging/envmonitor.py
similarity index 81%
rename from marl_factory_grid/logging/envmonitor.py
rename to marl_factory_grid/utils/logging/envmonitor.py
index c3496dc..67eac73 100644
--- a/marl_factory_grid/logging/envmonitor.py
+++ b/marl_factory_grid/utils/logging/envmonitor.py
@@ -6,11 +6,10 @@ from typing import Union
 from gymnasium import Wrapper
 
 from marl_factory_grid.utils.helpers import IGNORED_DF_COLUMNS
-from marl_factory_grid.environment.factory import REC_TAC
 
 import pandas as pd
 
-from marl_factory_grid.plotting.compare_runs import plot_single_run
+from marl_factory_grid.utils.plotting.compare_runs import plot_single_run
 
 
 class EnvMonitor(Wrapper):
@@ -23,8 +22,6 @@ class EnvMonitor(Wrapper):
         self._monitor_df = pd.DataFrame()
         self._monitor_dict = dict()
 
-    def __getattr__(self, item):
-        return getattr(self.unwrapped, item)
 
     def step(self, action):
         obs_type, obs, reward, done, info = self.env.step(action)
@@ -33,12 +30,12 @@ class EnvMonitor(Wrapper):
         return obs_type, obs, reward, done, info
 
     def reset(self):
-        return self.unwrapped.reset()
+        return self.env.reset()
 
     def _read_info(self, info: dict):
         self._monitor_dict[len(self._monitor_dict)] = {
             key: val for key, val in info.items() if
-            key not in ['terminal_observation', 'episode'] and not key.startswith(REC_TAC)}
+            key not in ['terminal_observation', 'episode']}
         return
 
     def _read_done(self, done):
@@ -50,7 +47,7 @@ class EnvMonitor(Wrapper):
                 {col: 'mean' if col.endswith('ount') else 'sum' for col in columns}
             )
             env_monitor_df['episode'] = len(self._monitor_df)
-            self._monitor_df = self._monitor_df.append([env_monitor_df])
+            self._monitor_df = pd.concat([self._monitor_df, pd.DataFrame([env_monitor_df])], ignore_index=True)
         else:
             pass
         return
diff --git a/marl_factory_grid/utils/logging/recorder.py b/marl_factory_grid/utils/logging/recorder.py
new file mode 100644
index 0000000..fac2e16
--- /dev/null
+++ b/marl_factory_grid/utils/logging/recorder.py
@@ -0,0 +1,160 @@
+from os import PathLike
+from pathlib import Path
+from typing import Union, List
+
+import yaml
+from gymnasium import Wrapper
+
+import numpy as np
+import pandas as pd
+
+
+class EnvRecorder(Wrapper):
+
+    def __init__(self, env, filepath: Union[str, PathLike] = None,
+                 episodes: Union[List[int], None] = None):
+        super(EnvRecorder, self).__init__(env)
+        self.filepath = filepath
+        self.episodes = episodes
+        self._curr_episode = 0
+        self._curr_ep_recorder = list()
+        self._recorder_out_list = list()
+
+    def reset(self):
+        self._curr_ep_recorder = list()
+        self._recorder_out_list = list()
+        self._curr_episode += 1
+        return self.env.reset()
+
+    def step(self, actions):
+        obs_type, obs, reward, done, info = self.env.step(actions)
+        if not self.episodes or self._curr_episode in self.episodes:
+            summary: dict = self.env.summarize_state()
+            # summary.update(done=done)
+            # summary.update({'episode': self._curr_episode})
+            # TODO Protobuff Adjustments                 ######
+            # summary.update(info)
+            self._curr_ep_recorder.append(summary)
+            if done:
+                self._recorder_out_list.append({'steps': self._curr_ep_recorder,
+                                                'episode_nr': self._curr_episode})
+                self._curr_ep_recorder = list()
+        return obs_type, obs, reward, done, info
+
+    def _finalize(self):
+        if self._curr_ep_recorder:
+            self._recorder_out_list.append({'steps': self._curr_ep_recorder.copy(),
+                                            'episode_nr': len(self._recorder_out_list)})
+
+    def save_records(self, filepath: Union[Path, str, None] = None,
+                     only_deltas=False,
+                     save_occupation_map=False,
+                     save_trajectory_map=False,
+                     ):
+        self._finalize()
+        filepath = Path(filepath or self.filepath)
+        filepath.parent.mkdir(exist_ok=True, parents=True)
+        # cls.out_file.unlink(missing_ok=True)
+        with filepath.open('wb') as f:
+            if only_deltas:
+                from deepdiff import DeepDiff
+                diff_dict = [DeepDiff(t1, t2, ignore_order=True)
+                             for t1, t2 in zip(self._recorder_out_list, self._recorder_out_list[1:])
+                             ]
+                out_dict = {'episodes': diff_dict}
+
+            else:
+                # TODO Protobuff Adjustments Revert
+                dest_prop = dict(
+                    n_dests=0,
+                    dwell_time=0,
+                    spawn_frequency=0,
+                    spawn_in_other_zone=False,
+                    spawn_mode=''
+                )
+                rewards_dest = dict(
+                    WAIT_VALID=0.00,
+                    WAIT_FAIL=0.00,
+                    DEST_REACHED=0.00,
+                )
+                mv_prop = dict(
+                    allow_square_movement=False,
+                    allow_diagonal_movement=False,
+                    allow_no_op=False,
+                )
+                obs_prop = dict(
+                    render_agents='',
+                    omit_agent_self=False,
+                    additional_agent_placeholder=0,
+                    cast_shadows=False,
+                    frames_to_stack=0,
+                    pomdp_r=self.env.params['General']['pomdp_r'],
+                    indicate_door_area=False,
+                    show_global_position_info=False,
+
+                )
+                rewards_base = dict(
+                    MOVEMENTS_VALID=0.00,
+                    MOVEMENTS_FAIL=0.00,
+                    NOOP=0.00,
+                    USE_DOOR_VALID=0.00,
+                    USE_DOOR_FAIL=0.00,
+                    COLLISION=0.00,
+
+                )
+
+                out_dict = {'episodes': self._recorder_out_list}
+            out_dict.update(
+                {'n_episodes': self._curr_episode,
+                 'metadata':dict(
+                     level_name=self.env.params['General']['level_name'],
+                     verbose=False,
+                     n_agents=len(self.env.params['Agents']),
+                     max_steps=100,
+                     done_at_collision=False,
+                     parse_doors=True,
+                     doors_have_area=False,
+                     individual_rewards=True,
+                     class_name='Where does this end up?',
+                     env_seed=69,
+
+                     dest_prop=dest_prop,
+                     rewards_dest=rewards_dest,
+                     mv_prop=mv_prop,
+                     obs_prop=obs_prop,
+                     rewards_base=rewards_base,
+                 ),
+                 # 'env_params': self.env.params,
+                 'header': self.env.summarize_header()
+                 })
+            try:
+                from marl_factory_grid.utils.proto import fiksProto_pb2
+                from google.protobuf import json_format
+
+                bulk = fiksProto_pb2.Bulk()
+                json_format.ParseDict(out_dict, bulk)
+                f.write(bulk.SerializeToString())
+                # yaml.dump(out_dict, f, indent=4)
+            except TypeError:
+                print('Shit')
+        print('done')
+
+        if save_occupation_map:
+            a = np.zeros((15, 15))
+            # noinspection PyTypeChecker
+            for episode in out_dict['episodes']:
+                df = pd.DataFrame([y for x in episode['steps'] for y in x['Agents']])
+
+                b = list(df[['x', 'y']].to_records(index=False))
+
+                np.add.at(a, tuple(zip(*b)), 1)
+
+            # a = np.rot90(a)
+            import seaborn as sns
+            from matplotlib import pyplot as plt
+            hm = sns.heatmap(data=a)
+            hm.set_title('Very Nice Heatmap')
+            plt.show()
+
+        if save_trajectory_map:
+            raise NotImplementedError('This has not yet been implemented.')
diff --git a/marl_factory_grid/plotting/__init__.py b/marl_factory_grid/utils/plotting/__init__.py
similarity index 100%
rename from marl_factory_grid/plotting/__init__.py
rename to marl_factory_grid/utils/plotting/__init__.py
diff --git a/marl_factory_grid/plotting/compare_runs.py b/marl_factory_grid/utils/plotting/compare_runs.py
similarity index 99%
rename from marl_factory_grid/plotting/compare_runs.py
rename to marl_factory_grid/utils/plotting/compare_runs.py
index 64623ad..cb5c853 100644
--- a/marl_factory_grid/plotting/compare_runs.py
+++ b/marl_factory_grid/utils/plotting/compare_runs.py
@@ -7,7 +7,7 @@ from typing import Union, List
 import pandas as pd
 
 from marl_factory_grid.utils.helpers import IGNORED_DF_COLUMNS
-from marl_factory_grid.plotting.plotting import prepare_plot
+from marl_factory_grid.utils.plotting.plotting import prepare_plot
 
 MODEL_MAP = None
 
diff --git a/marl_factory_grid/plotting/plotting.py b/marl_factory_grid/utils/plotting/plotting.py
similarity index 100%
rename from marl_factory_grid/plotting/plotting.py
rename to marl_factory_grid/utils/plotting/plotting.py
diff --git a/marl_factory_grid/utils/proto/__init__.py b/marl_factory_grid/utils/proto/__init__.py
new file mode 100644
index 0000000..e69de29
diff --git a/marl_factory_grid/utils/tools.py b/marl_factory_grid/utils/tools.py
index 7fc5aa5..7747c18 100644
--- a/marl_factory_grid/utils/tools.py
+++ b/marl_factory_grid/utils/tools.py
@@ -120,6 +120,7 @@ class ConfigExplainer:
 
     def _save_to_file(self, data: dict, filepath: PathLike, tag: str = ''):
         filepath = Path(filepath)
+        yaml.Dumper.ignore_aliases = lambda *args: True
         with filepath.open('w') as f:
             yaml.dump(data, f, encoding='utf-8')
         print(f'Example config {"for " + tag + " " if tag else " "}dumped')
diff --git a/reload_agent.py b/reload_agent.py
index 99cddc8..8c16069 100644
--- a/reload_agent.py
+++ b/reload_agent.py
@@ -4,8 +4,8 @@ from pathlib import Path
 import yaml
 
 from marl_factory_grid.environment.factory import Factory
-from marl_factory_grid.logging.envmonitor import EnvMonitor
-from marl_factory_grid.logging.recorder import EnvRecorder
+from marl_factory_grid.utils.logging.envmonitor import EnvMonitor
+from marl_factory_grid.utils.logging.recorder import EnvRecorder
 
 from marl_factory_grid.modules.doors import constants as d