🔱 Fork of ztxz16/fastllm — 专注于 Windows 平台的预编译版本
本项目是 fastllm 的 Windows 分支,提供:
- ✅ 预编译二进制文件 — 无需配置编译环境即可使用
- ✅ GitHub Actions 自动构建 — CPU 版本和 CUDA 版本
- ✅ 一键本地编译脚本 — 交互式 PowerShell 构建工具
前往 Releases 下载预编译版本:
| 版本 | 说明 |
|---|---|
fastllm-windows-cpu-x.x.x.zip |
仅 CPU,无需 GPU |
fastllm-windows-cuda-x.x.x.zip |
CUDA 加速,需要 NVIDIA GPU |
- 将
bin目录添加到系统 PATH 环境变量 - 确保已安装 Python 3.8+ (推荐 3.10+)
方式一:统一入口(推荐)
# 默认使用 C++ 原生程序
ftllm chat D:\Models\Qwen3 --device cuda
# 使用 Python 后端
ftllm -py chat D:\Models\Qwen3 --device cuda方式二:直接调用原生程序
FastllmStudio_cli.exe -p D:\Models\Qwen3 --device cuda参考上游文档:支持的模型列表
本项目配置了完整的 CI/CD 工作流,每次推送到 master 分支会自动触发编译。
- 推送到
master分支 - 创建 Pull Request 到
master分支 - 手动触发 (workflow_dispatch)
工作流会生成两个版本:
- CPU 版本: 纯 CPU 推理,兼容所有 Windows x64 系统
- CUDA 版本: GPU 加速,支持 RTX 20/30/40/50 全系列
- Fork 本仓库
- 修改代码后推送
- 前往 Actions 页面查看构建状态
- 构建完成后在 Artifacts 下载编译产物
如果创建 Release 标签 (如 v0.1.5.1),会自动发布到 Releases 页面。
# 克隆仓库
git clone https://github.com/Czerror/fastllm-windows.git
cd fastllm-windows
# 运行环境安装脚本 (自动检测并安装缺失的工具)
.\setup-env.ps1脚本会自动检测并安装:
- Visual Studio 2022 Build Tools — MSVC 编译器(必需)
- CMake — 便携版,自动集成到项目中
- CUDA Toolkit — 仅当检测到 NVIDIA GPU 时安装
| 组件 | 版本要求 |
|---|---|
| Windows | 10/11 x64 |
| Visual Studio | 2022 (含 C++ 桌面开发工具) |
| CMake | 3.18+ |
| CUDA Toolkit | 12.0+ (仅 CUDA 版本需要) |
| Python | 3.8+ (可选,用于 Python API) |
# 克隆仓库
git clone https://github.com/Czerror/fastllm-windows.git
cd fastllm-windows
# 初始化子模块
git submodule update --init --recursive
# 运行构建脚本 (交互式)
打开点我启动编译.bat交互式菜单会引导你选择:
- 构建目标: CPU / CUDA / 两者都构建
- CUDA 架构: 全架构 / 仅本机 GPU / 指定架构
- CMake 选项: 内存映射、SentencePiece、Python API 等
# 自动构建 CUDA 版本,仅编译本机 GPU 架构
.\build.ps1 -Auto -Target cuda -CudaArch native
# 自动构建 CPU 版本,不打包
.\build.ps1 -Auto -Target cpu -NoPackage
# 清理后重新构建
.\build.ps1 -Auto -Target both -Clean
# 构建全架构 CUDA (兼容 RTX 20/30/40/50)
.\build.ps1 -Auto -Target cuda -CudaArch "75;80;86;89;90;120"编译完成后,产物位于:
- 二进制文件:
build\x64\Release\ - 打包 ZIP:
build\fastllm-windows-[cpu|cuda]-x.x.x.zip
fastllm-windows/
├── .github/workflows/ # GitHub Actions 工作流
│ └── build-windows.yml # Windows 编译配置
├── build.ps1 # Windows 本地编译脚本
├── include/ # C++ 头文件
├── src/ # C++ 源码
├── tools/ # Python 工具和脚本
├── example/ # 示例代码
└── docs/ # 文档
- 上游仓库: ztxz16/fastllm
- 文档: docs/
- 部署 DeepSeek: docs/deepseek.md
- 部署 Qwen3: docs/qwen3.md
本项目遵循 Apache License 2.0,与上游 fastllm 保持一致。
- ztxz16/fastllm — 原项目作者
- 所有贡献者和社区成员