Thanks to visit codestin.com
Credit goes to github.com

Skip to content

NEXTLEO/cuda_demo

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

2 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

CUDA Demo Project for NVIDIA Jetson Orin NX

一个全面的CUDA编程演示项目,展示GPU并行计算的强大功能和优化技术。

🚀 快速开始

# 编译项目
./build.sh

# 运行演示
./build/cuda_demo

📚 详细文档

💡 项目亮点

  • 8个核心CUDA模块: 从基础操作到高级优化
  • 🧠 内存优化技术: 共享内存、合并访问、统一内存
  • 🖼️ 实用图像处理: 高斯模糊、边缘检测、卷积
  • 📊 性能基准测试: 量化的优化效果对比
  • 🎯 针对Jetson Orin NX优化: 充分利用Ampere架构

🎯 核心性能表现

算法类型 CPU性能 GPU性能 加速比
向量加法 0.5 GB/s 1.9 GB/s 3.8×
矩阵乘法 0.2 GFLOPS 2.4 GFLOPS 12×
图像模糊 4 MPixel/s 33 MPixel/s
颜色转换 100 MPixel/s 420 MPixel/s

🛠️ 系统要求

  • NVIDIA Jetson Orin NX (或其他CUDA兼容GPU)
  • CUDA Toolkit 11.0+ (推荐12.0+)
  • CMake 3.18+
  • C++17兼容编译器

📖 学习价值

这个项目适合:

  • CUDA编程初学者和进阶开发者
  • 需要GPU加速的应用开发
  • 高性能计算和并行算法研究
  • 嵌入式AI和实时图像处理

📄 许可证

MIT License - 仅用于教育和研究目的


🚀 立即开始您的CUDA高性能计算之旅!

About

CUDA Comprehensive Demo for NVIDIA Jetson Orin NX

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published