Thanks to visit codestin.com
Credit goes to github.com

haohaoXhang

Follow

🐩

On vacation

BIG_MOUSE haohaoXhang

🐩

On vacation

Follow

0 followers · 1 following

Achievements

Achievements

Popular repositories Loading

RLHF_learn RLHF_learn Public

这是一个从零开始构建的强化学习人类反馈（RLHF）学习代码库，实现了 PPO、GRPO、GSPO 以及相关的策略优化算法，并提供了清晰、可复现的训练流程。由于文档是由latex文件转译过来，如果md文件渲染异常，请用VScode的md插件打开

Python 76 2
astar_path_and_cubicpolytraj astar_path_and_cubicpolytraj Public

This is a homework assignment on trajectory planning, using the astar algorithm and third-order polynomials for trajectory planning.

C++
fuzzing-learning-in-30-days fuzzing-learning-in-30-days Public

Forked from u1f383/fuzzing-learning-in-30-days
person_learn person_learn Public
langchain-rag-tutorial langchain-rag-tutorial Public

Forked from pixegami/langchain-rag-tutorial

A simple Langchain RAG application.

Python
Bert-Chinese-Text-Classification-Pytorch Bert-Chinese-Text-Classification-Pytorch Public

Forked from 649453932/Bert-Chinese-Text-Classification-Pytorch

使用Bert，ERNIE，进行中文文本分类

Python