Codestin Search App

Introduction

On Pruning State-Space LLMs [arXiv]
Tamer Ghattas, Michael Hassid and Roy Schwartz
Hebrew University of Jerusalem

This repo include the adaptation of WANDA and FLAP pruning methods to Mamba2 models along with the headdim and dstate pruning methods explained in the paper. The code is based on the original repos, you'll find pruning methods implementations in the Mamba layer in each one of discrete_mamba2.py , mixer_seq_simple.py and hybrid_mamba_layer.py and modified versions of WANDA and FLAP.

Installation

conda create -n ssm-pruner python=3.10
conda activate ssm-pruner
pip install torch==2.4.0+cu121 --extra-index-url https://download.pytorch.org/whl/cu121 --no-cache-dir
pip install datasets==3.0.0
pip install transformers==4.48.1
pip install triton mamba-ssm==2.2.2 flash-attn==2.6.3: the core Mamba package.

Quickstart

WANDA

wanda/scripts/mamba.sh

FLAP

FLAP/scripts/mamba.sh

Headdim & State Pruning

python prune_mha.py

Smol2-Mamba-1.9B Making

This model was distilled from SmolLM2-1.7B using our implementation of MOHAWK in train.py.

Fine-tuning

For fine-tuning our pruned models with distillation loss we used finetune.py.

Citation

@misc{ghattas2025pruningstatespacellms,
      title={On Pruning State-Space LLMs}, 
      author={Tamer Ghattas and Michael Hassid and Roy Schwartz},
      year={2025},
      eprint={2502.18886},
      archivePrefix={arXiv},
      primaryClass={cs.CL},
      url={https://arxiv.org/abs/2502.18886}, 
}

Name		Name	Last commit message	Last commit date
Latest commit History 29 Commits
.idea		.idea
FLAP		FLAP
MambaInLlama		MambaInLlama
original_mamba		original_mamba
phi_mamba		phi_mamba
wanda		wanda
LICENSE		LICENSE
README.md		README.md
environment.yml		environment.yml
prune_mha.py		prune_mha.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Uh oh!

Uh oh!

Repository files navigation

Introduction

Installation

Quickstart

WANDA

FLAP

Headdim & State Pruning

Smol2-Mamba-1.9B Making

Fine-tuning

Citation

About

Uh oh!

Releases

Packages

Languages

Uh oh!

License

Uh oh!

tGhattas/SSM-Pruner

Folders and files

Latest commit

History

Repository files navigation

Introduction

Installation

Quickstart

WANDA

FLAP

Headdim & State Pruning

Smol2-Mamba-1.9B Making

Fine-tuning

Citation

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages