soonjune

soonjune

Achievements

pytorch-a2c-ppo-acktr-gail pytorch-a2c-ppo-acktr-gail Public

Forked from ikostrikov/pytorch-a2c-ppo-acktr-gail

PyTorch implementation of Advantage Actor Critic (A2C), Proximal Policy Optimization (PPO), Scalable trust-region method for deep reinforcement learning using Kronecker-factored approximation (ACKT…

Python
pytorch-soft-actor-critic pytorch-soft-actor-critic Public

Forked from pranz24/pytorch-soft-actor-critic

PyTorch implementation of soft actor critic

Python
recsim_ng-forked recsim_ng-forked Public

Forked from google-research/recsim_ng

RecSim NG: Toward Principled Uncertainty Modeling for Recommender Ecosystems

Jupyter Notebook
TempoRL TempoRL Public

Forked from automl/TempoRL

Python
facebookresearch/RandomizedValueFunctions facebookresearch/RandomizedValueFunctions Public archive

Randomized Value Functions via Multiplicative Normalizing Flows

Python 18 10
twoyak_back twoyak_back Public

Ruby