SAFE: Ray Distributed Alignment Training

A modular implementation of alignment algorithms with Ray-based distributed training for multi-GPU setups (8-N H100s).

Algorithms

SAFE: Entropy-Aware Predictive Controller with synchronized LRs and LayerNorm critics
Asymmetric KL: Double Soft-Min Critics with asymmetric KL penalty

Installation

cd notebooks/SAFE/safe
pip install -e .

Usage

Single GPU Training

python scripts/train.py --config configs/base.yaml --algorithm safe

Multi-GPU Distributed Training

# Start Ray (if not using existing cluster)
ray start --head --num-gpus=8

# Launch training
python scripts/train_distributed.py \
    --config configs/h100_8gpu.yaml \
    --algorithm safe \
    --num_gpus 8

Scaling to More GPUs

Simply change num_gpus in config or CLI:

python scripts/train_distributed.py --config configs/h100_16gpu.yaml --num_gpus 16

Project Structure

safe/
├── safe/
│   ├── config.py           # Configuration dataclasses
│   ├── controllers/        # KL controllers (asymmetric, entropy-aware, PID)
│   ├── models/             # Critic networks
│   ├── reward/             # Reward model utilities
│   ├── data/               # Dataset loaders
│   ├── trainers/           # SAFE, Asymmetric KL, PPO trainers
│   └── distributed/        # Ray distributed training
├── scripts/                # Training & evaluation scripts
└── configs/                # YAML configuration files

Requirements

Python >= 3.10
PyTorch >= 2.0
Ray >= 2.9.0
transformers, peft, accelerate

Name		Name	Last commit message	Last commit date
Latest commit History 7 Commits
configs		configs
notebooks		notebooks
safe		safe
scripts		scripts
README.md		README.md
pyproject.toml		pyproject.toml
requirements.txt		requirements.txt
setup.py		setup.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

SAFE: Ray Distributed Alignment Training

Algorithms

Installation

Usage

Single GPU Training

Multi-GPU Distributed Training

Scaling to More GPUs

Project Structure

Requirements

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

SAFE: Ray Distributed Alignment Training

Algorithms

Installation

Usage

Single GPU Training

Multi-GPU Distributed Training

Scaling to More GPUs

Project Structure

Requirements

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages