Inference-time Alignment in Continuous Space

This repository provides the implementation code for our paper accepted to the NeurIPS 2025: Inference-time Alignment in Continuous Space. In this paper, we propose SEA, a simple inference-time alignment algorithm that reformulates alignment as an iterative optimization procedure on an energy function over logits in the continuous space defined by the optimal RLHF policy for deep and effective alignment. Despite its simplicity, SEA enjoys promising performance on extensive benchmarks such as AdvBench and TruthfulQA, consistently and significantly outperforming state-of-the-art baselines across various base models.

Environment

Create a Python virtual environment using e.g. Conda:

conda create -n sea python=3.10 && conda activate sea

First, install PyTorch 2.1.2 from the PyTorch Installation Page.

Then, install the following packages:

pip install -r requirements.txt

Inference

See scripts, for example:

bash scripts/adv-llama3.2-1b-base.sh # Default Accelerate Port & GPU id
bash scripts/adv-llama3.2-1b-base.sh 29520 # Default Accelerate Port & Default GPU id
bash scripts/adv-llama3.2-1b-base.sh 29520 "2,4" # Specified Accelerate Port & GPU id

Evaluation

See scripts, for example:

bash scripts/eval.sh

Outputs

See outputs

Name		Name	Last commit message	Last commit date
Latest commit History 1 Commit
accelerate_configs		accelerate_configs
data		data
evaluation		evaluation
scripts		scripts
.gitignore		.gitignore
README.md		README.md
baseline.py		baseline.py
decoding.py		decoding.py
eval.py		eval.py
main.py		main.py
model.py		model.py
prompt.py		prompt.py
requirements.txt		requirements.txt
util.py		util.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

Inference-time Alignment in Continuous Space

Environment

Inference

Evaluation

Outputs

About

Uh oh!

Releases

Packages

Languages

yuanyige/sea

Folders and files

Latest commit

History

Repository files navigation

Inference-time Alignment in Continuous Space

Environment

Inference

Evaluation

Outputs

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages