luanfujun

🤖

Fujun Luan luanfujun

🤖

908 followers · 7 following

Apple

Achievements

x2 x4

Achievements

x2 x4

Highlights

Stars

unslothai / unsloth

Fine-tuning & Reinforcement Learning for LLMs. 🦥 Train OpenAI gpt-oss, DeepSeek, Qwen, Llama, Gemma, TTS 2x faster with 70% less VRAM.

Python 50,624 4,175 Updated Jan 13, 2026

ray-project / ray

Ray is an AI compute engine. Ray consists of a core distributed runtime and a set of AI Libraries for accelerating ML workloads.

Python 40,735 7,103 Updated Jan 13, 2026

volcengine / verl

verl: Volcano Engine Reinforcement Learning for LLMs

Python 18,272 3,015 Updated Jan 13, 2026

huggingface / trl

Train transformer language models with reinforcement learning.

Python 16,937 2,417 Updated Jan 12, 2026

openai / baselines

OpenAI Baselines: high-quality implementations of reinforcement learning algorithms

Python 16,617 4,950 Updated Aug 1, 2024

DLR-RM / stable-baselines3

PyTorch version of Stable Baselines, reliable implementations of reinforcement learning algorithms.

Python 12,505 2,038 Updated Dec 18, 2025

vwxyzjn / cleanrl

High-quality single file implementation of Deep Reinforcement Learning algorithms with research-friendly features (PPO, DQN, C51, DDPG, TD3, SAC, PPG)

Python 8,808 958 Updated Jul 8, 2025

OpenRLHF / OpenRLHF

An Easy-to-use, Scalable and High-performance Agentic RL Framework based on Ray (PPO & DAPO & REINFORCE++ & TIS & vLLM & Ray & Async RL)

Python 8,772 848 Updated Jan 8, 2026

WooooDyy / AgentGym-RL

Code and implementations for the paper "AgentGym-RL: Training LLM Agents for Long-Horizon Decision Making through Multi-Turn Reinforcement Learning" by Zhiheng Xi et al.

Python 553 59 Updated Sep 11, 2025

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Fujun Luan luanfujun

Achievements

Achievements

Highlights

Block or report luanfujun

Stars

unslothai / unsloth

ray-project / ray

volcengine / verl

huggingface / trl

openai / baselines

DLR-RM / stable-baselines3

vwxyzjn / cleanrl

OpenRLHF / OpenRLHF

WooooDyy / AgentGym-RL