Edward Beeching
🦕 edbeeching/decision-transformer-gym-hopper-medium 🗿 个人研发 💡 强化学习 👍 6 🔽 34485
Stable-Baselines3
🦕 sb3/ppo-Pendulum-v1 🗿 机构研发 💡 强化学习 👍 2 🔽 2088
Jack of All Trades project
🦕 jat-project/jat 🗿 机构研发 💡 强化学习 👍 92 🔽 84
Cainiao-AI
🦕 Cainiao-AI/GreedRL 🗿 机构研发 💡 强化学习 👍 24 🔽 0
Edward Beeching
🦕 edbeeching/decision-transformer-gym-hopper-expert 🗿 个人研发 💡 强化学习 👍 18 🔽 566
Antonin Raffin
🦕 araffin/ppo-LunarLander-v2 🗿 个人研发 💡 强化学习 👍 17 🔽 11
Center for Human-Compatible AI
🦕 HumanCompatibleAI/ppo-seals-CartPole-v0 🗿 机构研发 💡 强化学习 👍 16 🔽 737
PKU-Alignment
🦕 PKU-Alignment/beaver-7b-v1.0-reward 🗿 机构研发 💡 强化学习 👍 16 🔽 885
Thomas Simonini
🦕 ThomasSimonini/ppo-LunarLander-v2 🗿 个人研发 💡 强化学习 👍 14 🔽 13
Nicklas Hansen
🦕 nicklashansen/tdmpc2 🗿 个人研发 💡 强化学习 👍 13 🔽 0
PKU-Alignment
🦕 PKU-Alignment/beaver-7b-v1.0 🗿 机构研发 💡 强化学习 👍 10 🔽 12
PKU-Alignment
🦕 PKU-Alignment/beaver-7b-v1.0-cost 🗿 机构研发 💡 强化学习 👍 9 🔽 830
Thomas Simonini
🦕 ThomasSimonini/ML-Agents-SnowballFight-1vs1 🗿 个人研发 💡 强化学习 👍 7 🔽 11
Unity Technologies
🦕 unity/ML-Agents-Walker 🗿 机构研发 💡 强化学习 👍 7 🔽 0
Stable-Baselines3
🦕 sb3/tqc-PandaPickAndPlace-v1 🗿 机构研发 💡 强化学习 👍 6 🔽 22
Center for Human-Compatible AI
🦕 HumanCompatibleAI/ppo-Pendulum-v1 🗿 机构研发 💡 强化学习 👍 5 🔽 309
Chenchen Liu
🦕 chencliu/tqc-PandaPickAndPlace-v3 🗿 个人研发 💡 强化学习 👍 5 🔽 19
LINE
🦕 line-corporation/sacpo 🗿 机构研发 💡 强化学习 👍 5 🔽 8
Edward Beeching
🦕 edbeeching/decision-transformer-gym-walker2d-expert 🗿 个人研发 💡 强化学习 👍 4 🔽 12
HUANG1993
🦕 HUANG1993/GreedRL-VRP-pretrained-v1 🗿 个人研发 💡 强化学习 👍 4 🔽 0
Alperen ÜNLÜ
🦕 alperenunlu/PPO-LunarLander-v2 🗿 个人研发 💡 强化学习 👍 4 🔽 2
Yongyuan Liang
🦕 cheryyunl/Make-An-Agent 🗿 个人研发 💡 强化学习 👍 4 🔽 0
Thomas Simonini
🦕 ThomasSimonini/ppo-SpaceInvadersNoFrameskip-v4 🗿 个人研发 💡 强化学习 👍 3 🔽 18
Guillermo Barbadillo
🦕 ironbar/the-eagle-has-landed 🗿 个人研发 💡 强化学习 👍 3 🔽 3
Markus Bertheau
🦕 mbertheau/hf-drl-course-1-ppo-LunarLander-v2_1 🗿 个人研发 💡 强化学习 👍 3 🔽 13
Thomas Simonini
🦕 ThomasSimonini/ML-Agents-SoccerTwos-Good 🗿 个人研发 💡 强化学习 👍 3 🔽 27
OpenDILab
🦕 OpenDILabCommunity/PongNoFrameskip-v4-MuZero 🗿 机构研发 💡 强化学习 👍 3 🔽 0
LINE
🦕 line-corporation/p-sacpo 🗿 机构研发 💡 强化学习 👍 3 🔽 2
Thomas Simonini
🦕 ThomasSimonini/ppo-BreakoutNoFrameskip-v4 🗿 个人研发 💡 强化学习 👍 2 🔽 7
Omar Sanseviero
🦕 osanseviero/test_sb3 🗿 个人研发 💡 强化学习 👍 2 🔽 1
数据来源于huggingface.co, 仅供参考~