update readme and cleanup

scientist1642 · scientist1642 · commit 66e03ba134f5 · 2017-03-30T11:52:55.000+03:00
diff --git a/README.md b/README.md
@@ -22,6 +22,12 @@ Install most recent nightly build (version '0.1.10+2fd4d08' or later) of PyTorch
 pip install git+https://github.com/pytorch/pytorch
 `
 
+## Dependencies
+   * pytorch
+   * torchvision
+   * universe (for now)
+   * [tensorboard logger](https://github.com/TeamHG-Memex/tensorboard_logger)
+
 ## Results
 
 With 16 processes it converges for PongDeterministic-v3 in 15 minutes.
diff --git a/main.py b/main.py
@@ -65,8 +65,8 @@ def setup_loggings(args):
 if __name__ == '__main__':
     args = parser.parse_args()
     setup_loggings(args) 
-
     torch.manual_seed(args.seed)
+
     env = create_atari_env(args.env_name)
     shared_model = ActorCritic(
         env.observation_space.shape[0], env.action_space)
diff --git a/model.py b/model.py
@@ -44,12 +44,8 @@ def __init__(self, num_inputs, action_space):
         self.lstm = nn.LSTMCell(32 * 3 * 3, 256)
 
         num_outputs = action_space.n
-
         self.critic_linear = nn.Linear(256, 1)
         self.actor_linear = nn.Linear(256, num_outputs)
-        #self.critic_linear = nn.Linear(288, 1)
-        #self.actor_linear = nn.Linear(288, num_outputs)
-
         self.apply(weights_init)
         self.actor_linear.weight.data = normalized_columns_initializer(
             self.actor_linear.weight.data, 0.01)
diff --git a/train.py b/train.py
@@ -1,8 +1,6 @@
 import math
 import os
 import sys
-import resource 
-import gc
 
 import torch
 import torch.nn.functional as F