0% found this document useful (0 votes)

22 views2 pages

Multiplication - Ipynb - Colab

The document outlines the installation of the CUDA toolkit (version 11.2) and demonstrates a CUDA program for matrix multiplication. It includes commands to install CUDA, check the CUDA version, and compile a CUDA program that multiplies two square matrices. The program prompts the user for matrix sizes and elements, performs the multiplication, and displays the results.

Uploaded by

jshruti6896

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

22 views2 pages

Multiplication - Ipynb - Colab

Uploaded by

jshruti6896

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 2

# Install CUDA toolkit (example: CUDA 11.

2)
!apt-get update
!apt-get install -y cuda-toolkit-11-2

Hit:1 https://cloud.r-project.org/bin/linux/ubuntu jammy-cran40/ InRelease

Hit:2 https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2204/x86_64 InRelease
Hit:3 https://r2u.stat.illinois.edu/ubuntu jammy InRelease
Hit:4 http://archive.ubuntu.com/ubuntu jammy InRelease
Hit:5 http://security.ubuntu.com/ubuntu jammy-security InRelease
Hit:6 http://archive.ubuntu.com/ubuntu jammy-updates InRelease
Hit:7 http://archive.ubuntu.com/ubuntu jammy-backports InRelease
Hit:8 https://ppa.launchpadcontent.net/deadsnakes/ppa/ubuntu jammy InRelease
Hit:9 https://ppa.launchpadcontent.net/graphics-drivers/ppa/ubuntu jammy InRelease
Hit:10 https://ppa.launchpadcontent.net/ubuntugis/ppa/ubuntu jammy InRelease
Reading package lists... Done
W: Skipping acquire of configured file 'main/source/Sources' as repository 'https://r2u.stat.illinois.edu/ubuntu jammy InRelease' do
Reading package lists... Done
Building dependency tree... Done
Reading state information... Done
E: Unable to locate package cuda-toolkit-11-2

 

!nvcc --version

nvcc: NVIDIA (R) Cuda compiler driver

Copyright (c) 2005-2024 NVIDIA Corporation
Built on Thu_Jun__6_02:18:23_PDT_2024
Cuda compilation tools, release 12.5, V12.5.82
Build cuda_12.5.r12.5/compiler.34385749_0

!nvidia-smi

Mon Apr 28 03:21:41 2025

+-----------------------------------------------------------------------------------------+
| Processes: |
| GPU GI CI PID Type Process name GPU Memory |
| ID ID Usage |
|=========================================================================================|
| No running processes found |
+-----------------------------------------------------------------------------------------+

%%writefile mul.cu
#include <iostream>
#include <cuda_runtime.h>

global void matmul(int A, int B, int *C, int N) {

int Row = blockIdx.y * blockDim.y + threadIdx.y;
int Col = blockIdx.x * blockDim.x + threadIdx.x;
if (Row < N && Col < N) {
int Pvalue = 0;
for (int k = 0; k < N; k++) {
Pvalue += A[Row * N + k] * B[k * N + Col];
}
C[Row * N + Col] = Pvalue;
}
}

int main() {
int N;
std::cout << "Enter the size of the square matrices (N): ";
std::cin >> N;

int A = new int[N N];

int *B = new int[N * N];
int *C = new int[N * N];

std::cout << "Enter elements for matrix A:" << std::endl;

for (int i = 0; i < N * N; i++) {
std::cin >> A[i];
}
std::cout << "Enter elements for matrix B:" << std::endl;
for (int i = 0; i < N * N; i++) {
std::cin >> B[i];
}

int size = N * N * sizeof(int);

int dev_A, dev_B, *dev_C;

cudaMalloc(&dev_A, size);
cudaMalloc(&dev_B, size);
cudaMalloc(&dev_C, size);

cudaMemcpy(dev_A, A, size, cudaMemcpyHostToDevice);

cudaMemcpy(dev_B, B, size, cudaMemcpyHostToDevice);

dim3 dimBlock(16, 16);

dim3 dimGrid((N + dimBlock.x - 1) / dimBlock.x, (N + dimBlock.y - 1) / dimBlock.y);

matmul<<<dimGrid, dimBlock>>>(dev_A, dev_B, dev_C, N);

cudaDeviceSynchronize(); // Important!

cudaMemcpy(C, dev_C, size, cudaMemcpyDeviceToHost);

std::cout << "Matrix Multiplication Results (first 10x10):" << std::endl;

for (int i = 0; i < 10 && i < N; i++) {
for (int j = 0; j < 10 && j < N; j++) {
std::cout << C[i * N + j] << " ";
}
std::cout << std::endl;
}

cudaFree(dev_A);
cudaFree(dev_B);
cudaFree(dev_C);
delete[] A;
delete[] B;
delete[] C;

return 0;
}

Writing mul.cu

!nvcc mul.cu -o mul -arch=sm_75

!./mul

Enter the size of the square matrices (N): 3

Enter elements for matrix A:
1 1 1
1 1 1
1 1 1
Enter elements for matrix B:
2
2 2 2
2 2 2
2 2 2
Matrix Multiplication Results (first 10x10):
6 6 6
6 6 6
6 6 6

Start coding or generate with AI.

Xenia Canary Settings
No ratings yet
Xenia Canary Settings
12 pages
Untitled0.ipynb - Colab
No ratings yet
Untitled0.ipynb - Colab
2 pages
Introduction To CUDA
No ratings yet
Introduction To CUDA
51 pages
Xenia Config
No ratings yet
Xenia Config
14 pages
Cuda Binary Utilities: Application Note
No ratings yet
Cuda Binary Utilities: Application Note
41 pages
Introduction To CUDA C 3
No ratings yet
Introduction To CUDA C 3
67 pages
Singapore p1
No ratings yet
Singapore p1
46 pages
English To Hindi Text Translation
No ratings yet
English To Hindi Text Translation
10 pages
AcceleratingAIAdvancements Pre Print Doube Blind
No ratings yet
AcceleratingAIAdvancements Pre Print Doube Blind
9 pages
CUDA Programming Guide
No ratings yet
CUDA Programming Guide
57 pages
Part2 22
No ratings yet
Part2 22
97 pages
CUDA Libraries for Developers
No ratings yet
CUDA Libraries for Developers
86 pages
CUDA Exercises
No ratings yet
CUDA Exercises
185 pages
GMP Training for Medical Devices
67% (3)
GMP Training for Medical Devices
110 pages
CUDA Toolkit Release Notes
No ratings yet
CUDA Toolkit Release Notes
50 pages
CUDA Toolkit Release Notes
No ratings yet
CUDA Toolkit Release Notes
26 pages
Crack Detection with CNN
No ratings yet
Crack Detection with CNN
8 pages
CUDA Binary Utilities
No ratings yet
CUDA Binary Utilities
32 pages
CUDA Binary Utilities
No ratings yet
CUDA Binary Utilities
36 pages
Cuda Versions
No ratings yet
Cuda Versions
3 pages
CMake Lists
No ratings yet
CMake Lists
4 pages
Computación Distribuida y Paralela - Evidencia 3.ipynb - Colab
No ratings yet
Computación Distribuida y Paralela - Evidencia 3.ipynb - Colab
5 pages
Nvflash
No ratings yet
Nvflash
8 pages
CUDA Introduction
No ratings yet
CUDA Introduction
39 pages
Introduction To CUDA C
No ratings yet
Introduction To CUDA C
67 pages
Multi Gpu Programming With Mpi
No ratings yet
Multi Gpu Programming With Mpi
93 pages
Gpucoder Ug
No ratings yet
Gpucoder Ug
560 pages
S62256 - Demystify CUDA Debugging and Performance With Powerful Developer Tools
No ratings yet
S62256 - Demystify CUDA Debugging and Performance With Powerful Developer Tools
44 pages
Kopia Notatnika PolishCoinDetector - Ipynb - Colab
No ratings yet
Kopia Notatnika PolishCoinDetector - Ipynb - Colab
3 pages
CUDA Binary Utilities
No ratings yet
CUDA Binary Utilities
32 pages
Recipe For Running Simple CUDA Code On A GPU Based Rocks Cluster
No ratings yet
Recipe For Running Simple CUDA Code On A GPU Based Rocks Cluster
17 pages
Sysinfo 2024 09 28 19 59
No ratings yet
Sysinfo 2024 09 28 19 59
12 pages
GPU History & CUDA Programming Basics
No ratings yet
GPU History & CUDA Programming Basics
44 pages
Cuda Talk
100% (1)
Cuda Talk
82 pages
01 RL Fundamentals - Complete Beginner's Guide
No ratings yet
01 RL Fundamentals - Complete Beginner's Guide
22 pages
CUDA Programming Invert
No ratings yet
CUDA Programming Invert
36 pages
Setup
No ratings yet
Setup
3 pages
Addition - Ipynb - Colab
No ratings yet
Addition - Ipynb - Colab
2 pages
Gpu, Cuda and Pycuda
No ratings yet
Gpu, Cuda and Pycuda
11 pages
Introduccion CUDA C
No ratings yet
Introduccion CUDA C
51 pages
CUDA Binary Utilities
No ratings yet
CUDA Binary Utilities
41 pages
E
No ratings yet
E
7 pages
01 Cuda C Basics
No ratings yet
01 Cuda C Basics
32 pages
Lab Manual Computer Data Security & Privacy (COMP-324) : Course Coordinator: Dr. Sherif Tawfik Amin
No ratings yet
Lab Manual Computer Data Security & Privacy (COMP-324) : Course Coordinator: Dr. Sherif Tawfik Amin
51 pages
PRM 6
No ratings yet
PRM 6
1 page
Cheat Sheet CUDA
No ratings yet
Cheat Sheet CUDA
2 pages
C Make Lists
No ratings yet
C Make Lists
11 pages
Command Line Arguments and Settings AUTOMATIC1111 - Stable-Diffusion-Webui Wiki GitHub
No ratings yet
Command Line Arguments and Settings AUTOMATIC1111 - Stable-Diffusion-Webui Wiki GitHub
1 page
Intro to CUDA Programming Guide
No ratings yet
Intro to CUDA Programming Guide
33 pages
HPC Int2 Key
No ratings yet
HPC Int2 Key
10 pages
BECOA157 Parallel Matrix Multiplication
No ratings yet
BECOA157 Parallel Matrix Multiplication
3 pages
GPGPU Tutorial
No ratings yet
GPGPU Tutorial
155 pages
Cs-3006 8 Gpuprogramming Using Cuda&Opencl
No ratings yet
Cs-3006 8 Gpuprogramming Using Cuda&Opencl
167 pages
3 Cuda
No ratings yet
3 Cuda
5 pages
Cuda - New Features and Beyond Ampere Programming For Developers PDF
No ratings yet
Cuda - New Features and Beyond Ampere Programming For Developers PDF
78 pages
CUDA Tutorial
No ratings yet
CUDA Tutorial
50 pages
Source Code
No ratings yet
Source Code
7 pages
Predict The Price of The Uber Ride From A Given Pickup Point To The Agreed Drop-Off Location
No ratings yet
Predict The Price of The Uber Ride From A Given Pickup Point To The Agreed Drop-Off Location
9 pages
Nvidia - Ug - Matlab Gpu Coder
100% (1)
Nvidia - Ug - Matlab Gpu Coder
66 pages
CUDA Class Lecture01
No ratings yet
CUDA Class Lecture01
26 pages
Ambo Town Credit System Project
No ratings yet
Ambo Town Credit System Project
75 pages
MOSFET Basics for Engineering Students
No ratings yet
MOSFET Basics for Engineering Students
46 pages
Operating Manual-Sx60-100 Om 090824
No ratings yet
Operating Manual-Sx60-100 Om 090824
112 pages
Business Process Simulation Guide
No ratings yet
Business Process Simulation Guide
24 pages
CUDA Compute Unified Device Architecture
No ratings yet
CUDA Compute Unified Device Architecture
26 pages
DC Charging TCP/IP (Optional) Micro Usb (Optional) USB Link: Realtime T502
No ratings yet
DC Charging TCP/IP (Optional) Micro Usb (Optional) USB Link: Realtime T502
1 page
Weatherwax - Conte - Solution - Manual Capitulo 2 y 3
No ratings yet
Weatherwax - Conte - Solution - Manual Capitulo 2 y 3
59 pages
Bits ZG553 Ec-2r First Sem 2019-2020
No ratings yet
Bits ZG553 Ec-2r First Sem 2019-2020
2 pages
VLSI Testing - DFT and Scan
No ratings yet
VLSI Testing - DFT and Scan
35 pages
Itu-T G.841
No ratings yet
Itu-T G.841
98 pages
Service Level Management Upgrade Training: HPSM For HP Enterprise Services
No ratings yet
Service Level Management Upgrade Training: HPSM For HP Enterprise Services
32 pages
KKS Power Plant Identification System
No ratings yet
KKS Power Plant Identification System
3 pages
Res Net
No ratings yet
Res Net
13 pages
ECEN3250 Lab 7: Design of Common-Source MOS Amplifiers Prelab Assignment
No ratings yet
ECEN3250 Lab 7: Design of Common-Source MOS Amplifiers Prelab Assignment
14 pages
ITTO For PMP Exam
No ratings yet
ITTO For PMP Exam
8 pages
FRST
No ratings yet
FRST
19 pages
!!!!!!!!!AC SINGLE PHASE INDUCTION MOTOR SPEED CONTROL U2008b PDF
No ratings yet
!!!!!!!!!AC SINGLE PHASE INDUCTION MOTOR SPEED CONTROL U2008b PDF
6 pages
Rectangular Microstrip Antenna Design
No ratings yet
Rectangular Microstrip Antenna Design
3 pages
Soal Bangun Ruang - Geometry
No ratings yet
Soal Bangun Ruang - Geometry
7 pages
DIPS v7 Rosette Plot Manual
No ratings yet
DIPS v7 Rosette Plot Manual
20 pages
HPC Report 1
No ratings yet
HPC Report 1
12 pages
Cuda C/C++ Basics: NVIDIA Corporation
No ratings yet
Cuda C/C++ Basics: NVIDIA Corporation
67 pages
Masterclass Conclusion
No ratings yet
Masterclass Conclusion
12 pages
Bi 6 New
No ratings yet
Bi 6 New
6 pages
Western Systems Ruggedcom Rst916c
No ratings yet
Western Systems Ruggedcom Rst916c
5 pages
Math Homework Sheets For 6th Graders
No ratings yet
Math Homework Sheets For 6th Graders
7 pages
Erp Briefing
No ratings yet
Erp Briefing
4 pages
Tejesh Rathi's IT and Data Expertise
No ratings yet
Tejesh Rathi's IT and Data Expertise
1 page
MCQ Ec-405
No ratings yet
MCQ Ec-405
2 pages
SPLA Licensing Best Practices
No ratings yet
SPLA Licensing Best Practices
1 page
EAadhaar 0648019028606520240216115645 26022024194147
No ratings yet
EAadhaar 0648019028606520240216115645 26022024194147
1 page
Laser Spectroscopy Basic Concepts and Instrumentation 3rd Ed Wolfgang Demtrder PDF Download
100% (1)
Laser Spectroscopy Basic Concepts and Instrumentation 3rd Ed Wolfgang Demtrder PDF Download
16 pages

Multiplication - Ipynb - Colab

Uploaded by

Multiplication - Ipynb - Colab

Uploaded by

# Install CUDA toolkit (example: CUDA 11.

Hit:1 https://cloud.r-project.org/bin/linux/ubuntu jammy-cran40/ InRelease

nvcc: NVIDIA (R) Cuda compiler driver

Mon Apr 28 03:21:41 2025

__global__ void matmul(int *A, int *B, int *C, int N) {

int *A = new int[N * N];

std::cout << "Enter elements for matrix A:" << std::endl;

int size = N * N * sizeof(int);

int *dev_A, *dev_B, *dev_C;

cudaMemcpy(dev_A, A, size, cudaMemcpyHostToDevice);

dim3 dimBlock(16, 16);

matmul<<<dimGrid, dimBlock>>>(dev_A, dev_B, dev_C, N);

cudaMemcpy(C, dev_C, size, cudaMemcpyDeviceToHost);

std::cout << "Matrix Multiplication Results (first 10x10):" << std::endl;

!nvcc mul.cu -o mul -arch=sm_75

Enter the size of the square matrices (N): 3

Start coding or generate with AI.

You might also like

global void matmul(int A, int B, int *C, int N) {

int A = new int[N N];

int dev_A, dev_B, *dev_C;