vLLM CPU Images

Multi-arch (amd64 + arm64) Docker images for running vLLM with CPU backend.
Built automatically from upstream tags and commits.

Usage

Run an API server:

docker run --rm -p 8000:8000 \
  -e HUGGING_FACE_HUB_TOKEN=\$HF_TOKEN \
  gabrielbico/vllm-cpu:nightly \
  --model google/gemma-3-270m

These images are CPU only. For GPU builds, see the official vLLM docs.

Name		Name	Last commit message	Last commit date
Latest commit History 2 Commits
.github/workflows		.github/workflows
README.md		README.md
build_and_push.sh		build_and_push.sh