updated base factory

2025-05-23 15:26:43 +02:00 · 2021-05-10 10:50:45 +02:00 · 2021-05-10 10:50:45 +02:00 · a4a4ab067e
commit a4a4ab067e
parent ed10b3225d
2 changed files with 11 additions and 10 deletions
--- a/environments/factory/base_factory.py
+++ b/environments/factory/base_factory.py
@ -45,19 +45,16 @@ class BaseFactory(object):
            collisions_vec = self.state[:, x, y].copy()  # otherwise you overwrite the grid/state
            collisions_vec[i+1] = 0  # no self-collisions
            collision_vecs.append(collisions_vec)
-        self.handle_collisions(collisions_vec)
+        reward, info = self.step_core(collisions_vec, actions, r)
-        r += self.step_core(collisions_vec, actions, r)
+        r += reward
        if self.steps >= self.max_steps:
            self.done = True
-        return self.state, r, self.done, {}
+        return self.state, r, self.done, info
    def make_move(self, agent_i, old_pos, new_pos):
        (x, y), (x_new, y_new) = old_pos, new_pos
        self.state[agent_i+1, x, y] = 0
        self.state[agent_i+1, x_new, y_new] = 1
    def handle_collisions(self, vecs):
        pass
    def step_core(self, collisions_vec, actions, r):
-        return 0
+        return 0, {}
--- a/environments/factory/simple_factory.py
+++ b/environments/factory/simple_factory.py
@ -11,13 +11,17 @@ class SimpleFactory(BaseFactory):
        super().reset()
        dirt_slice = np.zeros((1, *self.state.shape[1:]))
        self.state = np.concatenate((self.state, dirt_slice))  # dirt is now the last slice
-        free_for_dirt = self.state.sum(0)
+        free_for_dirt = self.free_for_dirt()
        free_for_dirt = np.argwhere(free_for_dirt == 0)
        np.random.shuffle(free_for_dirt)
        for x, y in free_for_dirt[:self.max_dirt]:
            self.state[-1, x, y] = 1
        print(self.state)
    def free_for_dirt(self):
        free_for_dirt = self.state.sum(0)
        free_for_dirt = np.argwhere(free_for_dirt == 0)
        np.random.shuffle(free_for_dirt)
        return free_for_dirt
 if __name__ == '__main__':
    factory = SimpleFactory(n_agents=1, max_dirt=8)