Policy Gradient for CartPole-v1

This is a tensorflow implementation of a policy gradient algorithm for CartPole-v1 environment of OpenAI gym. In addition to the policy network, a value network is also lerned in order to reduce the variance during training.

Requirement

tensorflow 0.11
OpenAI gym

Training

	$ python main.py

Name		Name	Last commit message	Last commit date
Latest commit History 5 Commits
movies/cartpole-experiment-1		movies/cartpole-experiment-1
README.md		README.md
log.txt		log.txt
main.py		main.py
pg.py		pg.py
pg.pyc		pg.pyc
vis.py		vis.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Policy Gradient for CartPole-v1

Requirement

Training

About

Releases

Packages

Languages

shimaokasonse/rlpg

Folders and files

Latest commit

History

Repository files navigation

Policy Gradient for CartPole-v1

Requirement

Training

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages