IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> C++知识库 -> CUDA并行化向量相乘Example -> 正文阅读

[C++知识库]CUDA并行化向量相乘Example

该Example使用最基本的cudaMalloc(), cudaMemcpy()等函数以及Kernel函数实现了一个并行化向量相乘的案例 :

#include <iostream>

using namespace std;

static void HandleError(cudaError_t err, const char *file, int line) {

    // CUDA error handling from the "CUDA by example" book
    if (err != cudaSuccess) {
        printf("%s in %s at line %d\n", cudaGetErrorString(err), file, line);
        exit(EXIT_FAILURE);
    }
}

#define HANDLE_ERROR(err) (HandleError( err, __FILE__, __LINE__ ))

__global__ void product(const int *a, const int *b, int *c) {
    unsigned int index = threadIdx.x;
    c[index] = a[index] * b[index];
}

int main() {
    const int n = 10;

    int a[n];
    int b[n];

    // 初始化数据
    for (int i = 0; i < n; i++) {
        a[i] = i;
        b[i] = i;
    }

    int *aDev, *bDev, *cDev;

    // 申请device内存(device指代GPU,host指代CPU)
    HANDLE_ERROR(cudaMalloc((void **) &aDev, sizeof(int) * n));
    HANDLE_ERROR(cudaMalloc((void **) &bDev, sizeof(int) * n));
    HANDLE_ERROR(cudaMalloc((void **) &cDev, sizeof(int) * n));

    // 将host数据拷贝到device
    HANDLE_ERROR(cudaMemcpy((void *) aDev, (void *) a, sizeof(int) * n, cudaMemcpyHostToDevice));
    HANDLE_ERROR(cudaMemcpy((void *) bDev, (void *) b, sizeof(int) * n, cudaMemcpyHostToDevice));

    // 定义kernel的执行配置
    dim3 gridSize(1);
    dim3 blockSize(n);

    // 执行kernel
    product<<<gridSize, blockSize>>>(aDev, bDev, cDev);

    int c[n];

    // 将device得到的结果拷贝到host
    HANDLE_ERROR(cudaMemcpy(c, cDev, sizeof(int) * n, cudaMemcpyDeviceToHost));

    // 检查执行结果
    for (int i: c) {
        cout << i << endl;
    }

    // 释放device内存
    HANDLE_ERROR(cudaFree(aDev));
    HANDLE_ERROR(cudaFree(bDev));
    HANDLE_ERROR(cudaFree(cDev));

    return 0;
}
  C++知识库 最新文章
【C++】友元、嵌套类、异常、RTTI、类型转换
通讯录的思路与实现(C语言)
C++PrimerPlus 第七章 函数-C++的编程模块(
Problem C: 算法9-9~9-12:平衡二叉树的基本
MSVC C++ UTF-8编程
C++进阶 多态原理
简单string类c++实现
我的年度总结
【C语言】以深厚地基筑伟岸高楼-基础篇(六
c语言常见错误合集
上一篇文章           查看所有文章
加:2022-03-31 23:45:54  更:2022-03-31 23:49:32 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2025年1日历 -2025/1/10 20:27:58-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码