目录
1. 编译ncnn
2. 配置ncnn
3. 调用Vulkan
4. 总结
1. 编译ncnn
1. 编译opencv和portobuf,也可以直接下载windows版本的opencv
2. 安装vulkan,直接取官网下载
3. 下载ncnn源码:
git clone https://github.com/Tencent/ncnn.git
4. 下载补充包:
cd ncnn
git submodule update --init
5. 打开vs终端(X64 native tools...)
6. 输入编译脚本:
// 生成Makefile, -DNCNN_VULKAN=ON 编译vulkan,使用gpu加速
cmake -G"NMake Makefiles" -DCMAKE_BUILD_TYPE=Release -DCMAKE_INSTALL_PREFIX=./install -DProtobuf_INCLUDE_DIR=D:/working_soft/protobuf/protobuf-3.4.0/build-vs2019/install/include -DProtobuf_LIBRARIES=D:/working_soft/protobuf/protobuf-3.4.0/build-vs2019/install/lib/libprotobuf.lib -DProtobuf_PROTOC_EXECUTABLE=D:/working_soft/protobuf/protobuf-3.4.0/build-vs2019/install/bin/protoc.exe -DNCNN_VULKAN=ON ..
// 编译
nmake
// 安装
nmake install
2. 配置ncnn
在vs studio中ncnn配置如下,附加依赖项必须按照文中顺序
包含目录
D:\working_soft\Vulkan\Include
D:\working_soft\opencv34111\build\install\include
D:\working_soft\opencv34111\build\install\include\opencv2
D:\working_soft\ncnn\ncnn\ncnn\build\install\include
D:\working_soft\ncnn\ncnn\ncnn\build\install\include\ncnn
附加库目录
D:\working_soft\Vulkan\Lib
D:\working_soft\opencv34111\build\install\x64\vc16\lib
D:\working_soft\ncnn\ncnn\ncnn\build\install\lib
D:\working_soft\protobuf\protobuf-3.4.0\build-vs2019\install\lib
附加依赖项
opencv_world341.lib
D:\working_soft\ncnn\ncnn\ncnn\build\install\lib\ncnn.lib
D:\working_soft\Vulkan\Lib\vulkan-1.lib
D:\working_soft\ncnn\ncnn\ncnn\build\install\lib\SPIRV.lib
D:\working_soft\ncnn\ncnn\ncnn\build\install\lib\glslang.lib
D:\working_soft\ncnn\ncnn\ncnn\build\install\lib\MachineIndependent.lib
D:\working_soft\ncnn\ncnn\ncnn\build\install\lib\OGLCompiler.lib
D:\working_soft\ncnn\ncnn\ncnn\build\install\lib\OSDependent.lib
D:\working_soft\ncnn\ncnn\ncnn\build\install\lib\GenericCodeGen.lib
3. 调用Vulkan
示例:
ncnn::create_gpu_instance();
ncnn::VulkanDevice vkdev(1); // 使用GPU1
ncnn::Net yolov5;
yolov5.opt.use_packing_layout = true;
yolov5.opt.use_vulkan_compute = true; // 使用vulkan
yolov5.opt.use_bf16_storage = true;
yolov5.set_vulkan_device(&vkdev);
yolov5.load_param("./model/yolov5s_6.0.param");
yolov5.load_model("./model/yolov5s_6.0.bin");
4. 总结
使用默认的ncnn时,会调用集显,速度已经很快;
使用vulkan,调用集显时,速度一致,使用显卡时,速度更慢了,可能是显卡太垃圾了,离谱。
经测试,主要加速方式为:yolov5.opt.use_bf16_storage
有没有大佬可以讲一下到底哪里出问题了,欢迎评论区留言。
|