From 8a11c9028cb5dd0f04437a842020aebe018327fa Mon Sep 17 00:00:00 2001
From: Ken Dreyer <kdreyer@redhat.com>
Date: Mon, 28 Apr 2025 11:27:28 -0400
Subject: [PATCH] use constraints-dev.txt in e2e tests

For instructlab, "pip install ." does not install vllm, but it does
install an uncapped torch (2.7.0 currently).

When we install vllm later, we compile a binary flash_attn wheel against
torch 2.7.0. vllm 0.8.4 requires torch==2.6.0, so we downgrade torch,
and then we use that with the incompatible flash_attn binary wheel.

To resolve this, use constraints-dev.txt in the first pip install
operation. This restricts torch to 2.6.0 immediately when we first
install instructlab, so that we will compile flash_attn against that
torch version.

Signed-off-by: Ken Dreyer <kdreyer@redhat.com>
---
 .github/workflows/e2e-aws-custom.yml           | 2 +-
 .github/workflows/e2e-nvidia-l4-x1.yml         | 2 +-
 .github/workflows/e2e-nvidia-l40s-x4-llama.yml | 2 +-
 .github/workflows/e2e-nvidia-l40s-x4-py312.yml | 2 +-
 .github/workflows/e2e-nvidia-l40s-x4.yml       | 2 +-
 .github/workflows/e2e-nvidia-l40s-x8.yml       | 2 +-
 .github/workflows/e2e-nvidia-t4-x1.yml         | 2 +-
 7 files changed, 7 insertions(+), 7 deletions(-)

diff --git a/.github/workflows/e2e-aws-custom.yml b/.github/workflows/e2e-aws-custom.yml
index 970ffb78f2..7960732902 100644
--- a/.github/workflows/e2e-aws-custom.yml
+++ b/.github/workflows/e2e-aws-custom.yml
@@ -148,7 +148,7 @@ jobs:
           nvidia-smi
           python3.11 -m pip cache remove llama_cpp_python
 
-          CMAKE_ARGS="-DGGML_CUDA=on" python3.11 -m pip install -v .
+          CMAKE_ARGS="-DGGML_CUDA=on" python3.11 -m pip install -v . -c constraints-dev.txt
 
           # https://github.com/instructlab/instructlab/issues/1821
           # install with Torch and build dependencies installed
diff --git a/.github/workflows/e2e-nvidia-l4-x1.yml b/.github/workflows/e2e-nvidia-l4-x1.yml
index a4f59abeab..9b2063b3d3 100644
--- a/.github/workflows/e2e-nvidia-l4-x1.yml
+++ b/.github/workflows/e2e-nvidia-l4-x1.yml
@@ -129,7 +129,7 @@ jobs:
           nvidia-smi
           python3.11 -m pip cache remove llama_cpp_python
 
-          CMAKE_ARGS="-DGGML_CUDA=on" python3.11 -m pip install -v .
+          CMAKE_ARGS="-DGGML_CUDA=on" python3.11 -m pip install -v . -c constraints-dev.txt
 
           # https://github.com/instructlab/instructlab/issues/1821
           # install with Torch and build dependencies installed
diff --git a/.github/workflows/e2e-nvidia-l40s-x4-llama.yml b/.github/workflows/e2e-nvidia-l40s-x4-llama.yml
index a72ab8049a..cbb075e202 100644
--- a/.github/workflows/e2e-nvidia-l40s-x4-llama.yml
+++ b/.github/workflows/e2e-nvidia-l40s-x4-llama.yml
@@ -171,7 +171,7 @@ jobs:
           nvidia-smi
           python3.11 -m pip cache remove llama_cpp_python
 
-          CMAKE_ARGS="-DGGML_CUDA=on" python3.11 -m pip install -v .
+          CMAKE_ARGS="-DGGML_CUDA=on" python3.11 -m pip install -v . -c constraints-dev.txt
 
           # https://github.com/instructlab/instructlab/issues/1821
           # install with Torch and build dependencies installed
diff --git a/.github/workflows/e2e-nvidia-l40s-x4-py312.yml b/.github/workflows/e2e-nvidia-l40s-x4-py312.yml
index d0fce0c663..705a802e52 100644
--- a/.github/workflows/e2e-nvidia-l40s-x4-py312.yml
+++ b/.github/workflows/e2e-nvidia-l40s-x4-py312.yml
@@ -141,7 +141,7 @@ jobs:
           nvidia-smi
           python3.12 -m pip cache remove llama_cpp_python
 
-          CMAKE_ARGS="-DGGML_CUDA=on" python3.12 -m pip install -v .
+          CMAKE_ARGS="-DGGML_CUDA=on" python3.12 -m pip install -v . -c constraints-dev.txt
 
           # https://github.com/instructlab/instructlab/issues/1821
           # install with Torch and build dependencies installed
diff --git a/.github/workflows/e2e-nvidia-l40s-x4.yml b/.github/workflows/e2e-nvidia-l40s-x4.yml
index d481820e9d..6c7f3c3dd7 100644
--- a/.github/workflows/e2e-nvidia-l40s-x4.yml
+++ b/.github/workflows/e2e-nvidia-l40s-x4.yml
@@ -141,7 +141,7 @@ jobs:
           nvidia-smi
           python3.11 -m pip cache remove llama_cpp_python
 
-          CMAKE_ARGS="-DGGML_CUDA=on" python3.11 -m pip install -v .
+          CMAKE_ARGS="-DGGML_CUDA=on" python3.11 -m pip install -v . -c constraints-dev.txt
 
           # https://github.com/instructlab/instructlab/issues/1821
           # install with Torch and build dependencies installed
diff --git a/.github/workflows/e2e-nvidia-l40s-x8.yml b/.github/workflows/e2e-nvidia-l40s-x8.yml
index 5b69c1282e..a4308f3f3d 100644
--- a/.github/workflows/e2e-nvidia-l40s-x8.yml
+++ b/.github/workflows/e2e-nvidia-l40s-x8.yml
@@ -221,7 +221,7 @@ jobs:
           nvidia-smi
           python3.11 -m pip cache remove llama_cpp_python
 
-          CMAKE_ARGS="-DGGML_CUDA=on" python3.11 -m pip install -v .
+          CMAKE_ARGS="-DGGML_CUDA=on" python3.11 -m pip install -v . -c constraints-dev.txt
 
           # https://github.com/instructlab/instructlab/issues/1821
           # install with Torch and build dependencies installed
diff --git a/.github/workflows/e2e-nvidia-t4-x1.yml b/.github/workflows/e2e-nvidia-t4-x1.yml
index c3325f70c0..07b4a9a59f 100644
--- a/.github/workflows/e2e-nvidia-t4-x1.yml
+++ b/.github/workflows/e2e-nvidia-t4-x1.yml
@@ -136,7 +136,7 @@ jobs:
           nvidia-smi
           python3.11 -m pip cache remove llama_cpp_python
 
-          CMAKE_ARGS="-DGGML_CUDA=on" python3.11 -m pip install -v .
+          CMAKE_ARGS="-DGGML_CUDA=on" python3.11 -m pip install -v . -c constraints-dev.txt
 
           # https://github.com/instructlab/instructlab/issues/1821
           # install with Torch and build dependencies installed