hanyang1999

Follow

hanyang1999 hanyang1999

Follow

Freshman Researcher_ Reinforcement Learning, Stochastic Modeling

9 followers · 12 following

Highlights

Pro

Pinned Loading

Preference-Tuning-with-Human-Feedback Preference-Tuning-with-Human-Feedback Public

Githun Repo for “Preference Tuning with Human Feedback on Language, Speech, and Vision Tasks: A Survey”

4
RainbowPO RainbowPO Public

Implementation of RainbowPO based on TRL

Python 1
Improved-RLHF-for-Diffusion-Models Improved-RLHF-for-Diffusion-Models Public

Code implementation for "Improved techniques in RLHF for Diffusion Models"

Python 2