holarissun

Follow

🎯

Focusing

Hao Sun holarissun

🎯

Focusing

Follow

PhD in Reinforcement Learning, LLM Alignment, RLHF

70 followers · 33 following

University of Cambridge
https://holarissun.github.io/
@HolarisSun

Achievements

Achievements

Pinned Loading

Prompt-OIRL Prompt-OIRL Public

code for paper Query-Dependent Prompt Evaluation and Optimization with Offline Inverse Reinforcement Learning

Python 33 5
PanelGPT PanelGPT Public

We introduce new zero-shot prompting magic words that improves the reasoning ability of language models: panel discussion!

Python 133 11
RewardModelingBeyondBradleyTerry RewardModelingBeyondBradleyTerry Public

8
RewardShifting RewardShifting Public

Code for NeurIPS 2022 paper Exploiting Reward Shifting in Value-Based Deep RL

Python 27 2
YangRui2015/AWGCSL YangRui2015/AWGCSL Public

Code for ICLR 2022 paper Rethinking Goal-Conditioned Supervised Learning and Its Connection to Offline RL.

Python 26 2
PCHID_code PCHID_code Public

Code for [NeurIPS'2019 Spotlight] Policy Continuation with Hindsight Inverse Dynamics

Jupyter Notebook 15