TL;DR

🔧 Training Code

To train the models, you must first deploy an inference acceleration service and record its node IP. Then, run the corresponding training script.

For DS-R1-7B:

# Start the inference accelerator and record the node IP (e.g., 225.13.1.4)
bash ./train_script/train_7B_1_vs_1/7b_parameter_serve.sh

# Begin training using the recorded IP
SERVE_NODE_IP='225.13.1.4' bash ./train_script/train_7B_1_vs_1/max_step_2000_eval_step_32_init_1_vs_1.sh

For DS-R1-14B:

# Start the inference accelerator and record the node IP (e.g., 225.13.1.4)
bash ./train_script/train_14B_1_vs_1/14b_parameter_serve.sh

SERVE_NODE_IP='225.13.1.4' bash ./train_script/train_14B_1_vs_1/max_step_2000_eval_step_32_init_1_vs_1.sh

📊 Evaluation Code

Evaluation scripts for TLDR and baselines are included. To run evaluation:

bash ./eval_script/eval_tldr_weight.sh

📁 Evaluation Results

bash ./eval_script/eval_tldr_weight.sh

📦 Dataset

We provide the training data used in our experiments under the ./data/data_repo directory:

./data/data_repo/7b_train: Training data for the 7B model
./data/data_repo/14b_data: Training data for the 14B model
./data/data_repo/eval_set: Validation set data

Name		Name	Last commit message	Last commit date
Latest commit History 5 Commits
assets		assets
data		data
devset_cache		devset_cache
eval_script		eval_script
reason_eval_log		reason_eval_log
scripts		scripts
skythought		skythought
src		src
train_script		train_script
vllm_log		vllm_log
.DS_Store		.DS_Store
README.md		README.md
analysis_checkpoint_on_dev.py		analysis_checkpoint_on_dev.py
merge_lora.py		merge_lora.py
pyproject.toml		pyproject.toml
requirement.txt		requirement.txt
setup.py		setup.py
token_usage_script.py		token_usage_script.py
zero_2_fp32.py		zero_2_fp32.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

TL;DR

🔧 Training Code

📊 Evaluation Code

📁 Evaluation Results

📦 Dataset

About

Uh oh!

Releases

Packages

Contributors 2

Uh oh!

Languages

zzli2022/TLDR

Folders and files

Latest commit

History

Repository files navigation

TL;DR

🔧 Training Code

📊 Evaluation Code

📁 Evaluation Results

📦 Dataset

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Contributors 2

Uh oh!

Languages

Packages