C++多维数组库的比较
简单比较了 Fastor、Eigen Tensor、Boost Multiarray、blitz++ 等多维数组库循环访问大型数组的速度。
库的安装
这些库基本都可以以头文件形式直接使用,其中blitz++可以用CMAKE安装,操作平台为VS 2019:
- Boost Multiarray库下载连接下载之后直接包含头文件,并且添加include文件夹路径到VS 项目配置属性的VC++ 库目录和常规中的附加包含目录,可能会缺少一些头文件,可以去Boost库下载网站下载完整的boost库补全缺少的头文件。
- Eigen库下载链接可以直接下载3.4.0解压,包含头文件路径(如上),其中unsupported模块Tensor可以支持最多250维度的多维数组。
- Fastor库 下载连接固定的多维数组,直接下载解压,包含头文件即可使用。
- Blitz++下载连接可以使用CMAKE工具安装,然后包含头文件即可。CMAKE的windows下操作为:文件夹下shift+鼠标右键打开powershell输入以上命令,然后需生成静态库并链接:
测试循环速度
#include"blitz/array.h"
#include"E:/eigen-3.4.0/unsupported/Eigen/CXX11/Tensor"
#include"boost/multi_array.hpp"
#include<Fastor/Fastor.h>
#define BOOST_DISABLE_ASSERTS
#include<cassert>
#include<fstream>
#define XX 900
#define YY 800
#define ZZ 9
using namespace std;
int main(int argc, char* argv[])
{
double* nativeMatrix = new double[XX * YY*ZZ];
double stt = clock();
for (int l = 0; l < 500; ++l)
{
for (int k = 0; k < 9; ++k)
{
for (int j = 0; j < 800; ++j)
{
for (int i = 0; i < 900; ++i)
{
nativeMatrix[ i+ (j * YY) + k * YY*XX] = 1.0;
}
}
}
}
double edd = clock();
cout << (double)(edd - stt )/CLOCKS_PER_SEC<< endl;
using array3D=boost::multi_array<double, 3>;
double st0 = clock();
array3D A(boost::extents[900][800][9]);
for (int l = 0; l < 500; ++l)
{
for (int i = 0; i < 900; ++i)
{
for (int j = 0; j < 800; ++j)
{
for (int k = 0; k < 9; ++k)
{
A[i][j][ k] = 1.0;
}
}
}
}
double ed0 = clock();
cout<<(double)(ed0-st0) / CLOCKS_PER_SEC << endl;
double st = clock();
blitz::Array<double, 3> Q(900, 800, 9);
for (int l = 0; l < 500; ++l)
{
for (int i = 0; i < 900; ++i)
{
for (int j = 0; j < 800; ++j)
{
for (int k = 0; k < 9; ++k)
{
Q(i, j, k) = 1.0;
}
}
}
}
double ed = clock();
cout << (double)(ed - st) / CLOCKS_PER_SEC << endl;
Eigen::TensorFixedSize<double,Eigen::Sizes<900,800,9>> U;
double st1 = clock();
for (int l = 0; l < 500; ++l)
{
for (int k = 0; k <9; ++k)
{
for (int j = 0; j < 800; ++j)
{
for (int i = 0; i < 900; ++i)
{
U(i, j, k) = 1.0;
}
}
}
}
double ed1 = clock();
cout << (double)(ed1 - st1) / CLOCKS_PER_SEC << endl;
double st3 = clock();
Fastor::Tensor<double, XX, YY, ZZ> B;
for (int l = 0; l < 500; ++l)
{
for (int k = 0; k < 9; ++k)
{
for (int j = 0; j < 800; ++j)
{
for (int i = 0; i < 900; ++i)
{
B(i, j, k) = 1.0;
}
}
}
}
double ed3 = clock();
cout <<(double) (ed3 - st3)/CLOCKS_PER_SEC << endl;
double st2 = clock();
double S[XX][YY][ZZ];
for (int l = 0; l <500; ++l)
{
for (int i = 0; i <XX; ++i)
{
for (int j = 0; j <YY; ++j)
{
for (int k = 0; k < ZZ; ++k)
{
S[i][ j][ k] = 1.0;
}
}
}
}
double ed2 = clock();
cout << (double)(ed2 - st2)/CLOCKS_PER_SEC << endl;
return 0;
}
结果
循环500次给900X800X9的三维数组赋值,Realse模式耗时如下:
另外。这些有些行优先,有些列优先,所以通过调整i,j,k循环顺序找出最小耗时,测试过程开启了VS矢量对齐增强功能: 由于原生数组和Fastor只支持固定大小数组尺寸,编译器经过优化,耗时为0,但是数组尺寸不可更改有些不方便
Fortran
program main
implicit none
integer:: a,b,c,i,j,k,l
real(8),allocatable:: x(:,:,:),y(:,:,:)
real(8) time_begin , time_end1
allocate(x(900,800,9))
call CPU_TIME(time_begin)
do l=1,500
do k=1,9
do j=1,800
do i=1,900
x(i,j,k)=1.0
enddo
enddo
enddo
enddo
call CPU_TIME(time_end1)
write( *,*) time_end1-time_begin
stop
end program main
运行结果如下:可见多维动态数组还是Fortran支持的更好一些。
|