feature(zt): add stochastic muzero #45

timothijoe · 2023-06-10T09:01:56Z

add mcts ptree and ctree into muzero
add atari config

lzero/mcts/tree_search/mcts_ctree_stochastic.py

zoo/atari/config/atari_stochastic_muzero.py

lzero/model/stochastic_muzero_model.py

lzero/policy/stochastic_muzero.py

puyuan1996 · 2023-06-12T04:31:45Z

zoo/atari/config/atari_stochastic_muzero.py

@@ -0,0 +1,100 @@
+from easydict import EasyDict


rename to atari_stochastic_muzero_config.py

增加2048相关环境和config，以及cartpole/lunarlander的相关stochastic_muzero_config

zoo/atari/config/atari_stochastic_muzero.py

lzero/model/stochastic_muzero_model.py

puyuan1996 · 2023-06-16T03:59:07Z

lzero/model/stochastic_muzero_model.py

+    def get_reward_mean(self) -> float:
+        return get_reward_mean(self)
+
+class AfterstateDynamicsNetwork(nn.Module):


AfterstateDynamicsNetwork和AfterstatePredictionNetwork的网络结构你看看原文是否是和DynamicsNetwork和PredictionNetwork一样的，应该是可以有特殊设计的，以及对齐一下相应的loss_weight。

lzero/model/stochastic_muzero_model.py

zoo/game_2048/envs/game_2048_env.py

puyuan1996 · 2023-08-08T18:08:01Z

We have a new polished PR.

timothijoe added 2 commits June 10, 2023 11:33

add stochastic mz ptree

27d9b01

add stochastic mz ctree

3799b46

PaParaZz1 added the enhancement New feature or request label Jun 10, 2023

PaParaZz1 requested changes Jun 10, 2023

View reviewed changes

puyuan1996 requested changes Jun 12, 2023

View reviewed changes

add box2d, classic conrol, and 2048 config

14e3822

puyuan1996 requested changes Jun 16, 2023

View reviewed changes

蒲源 added 2 commits June 16, 2023 12:13

made corrections to the comments and naming issues

06c0558

made corrections to the comments and naming issues

fa88aab

puyuan1996 closed this Aug 8, 2023

Provide feedback