1、引言
小屌丝:鱼哥,我今天被鄙视了 小鱼:因为你的颜值被鄙视了?? 小屌丝:咱还能正常聊天吗?? 小鱼:好吧,我已经很正经的说话了,那你说吧,因为啥被鄙视了? 小屌丝:今天一个小菜鸟说C语言是世界上运行速度最快的语言,我非常不服气~~ 小鱼:那有啥不服气的,我都觉得这话说得没啥毛病。 小屌丝:鱼哥,小姐姐说谁的速度快,就跟谁YYSX。 小鱼:那…这… 我赞同,我也表示不服。
看样子,小姐姐是动力的源头!
2、Numba
关于Numba的详细文档,点击Numba传送门即被可传送。 但是文档归文档,我们还是要简单的说一下Numba。
2.1 简介
numba 是一款可以将 python 函数编译为机器代码的JIT编译器,经过 numba 编译的python 代码(仅限数组运算),其运行速度可以接近 C 或 FORTRAN 语言。
小屌丝:看样子很厉害的哦,那使用起来,是不是很难呢? 小鱼:不难不难,到底有多容易,请往下看:
三不要:
- 不需要替换Python解析器
- 不需要单独编译
- 不需要安装C/C++编译器
一需要:
- 将 Numba 提供的装饰器放在 Python 函数上面就行
小屌丝:哎哟~总结的还挺到位。 小鱼:没事别说话,打断我思路了都!!
2.2 安装
在撸码前,需要确认,是否已经有numba这个库, 如果没有的话,那我们回想一下,有几种方法呢???
不管哪种方法,能安装上就是可行的。 在这里,小鱼就直接举例单独安装:
pip install numba
详细可参考: 《Python3:我低调的只用一行代码,就导入Python所有库!》; 《Python3,选择Python自动安装第三方库,从此跟pip说拜拜!!》
2.3 代码实例
安装完numba库,那就直接上代码,展示一下速度…
看看能不能比我们的苏神跑的快!
实例一: 我们看看调用jit的样子
from numba import jit
import random
@jit(nopython=True)
def mot_pi(nsamples):
acc =0
for i in range(nsamples):
x = random.random()
y = random.random()
if (x ** 2 + y ** 2) <1.0 :
acc +=1
return 8.0 * acc /nsamples
实例二 Numba 是专为科学计算而设计的,在与 NumPy 一起使用时,Numba 会为不同的数组数据类型生成专门的代码,以优化性能为主, 上代码:
@numba.jit(nopython=True, parallel=True)
def logistic_regress(X, Y, w, iterations):
for i in range(iterations):
w -= np.dot(((1.0 /
(1.0 + np.exp(-Y * np.dot(X, w)))
- 1.0) * Y), X)
return w
小屌丝:这个…我看不懂… 小鱼:看不懂啊,没关系,毕竟不是每个人都对科学计算有兴趣。 小屌丝:你这是在侮(xiu)辱我!!! 小鱼:你不配~ ~
如果大家看不懂这个实例,没事没事,别灰心, 接下来,我们就来搞个大一点的事情。
3、 代码实战
上面的代码,就是一个热身了~ ~ 接下来,我们就用正儿八经的例子,看看Numba的运行速度有多快。
有了苏神的速度,还担心妹子不跟咱YYXS吗!!
举个例子 我们使用和不使用Numba,来找出1000个W以内所有的素数。
3.1 不使用Numba
我们不使用Numba,来看看花费多长时间。 上代码
import math
import time
def is_prime(num):
if num == 2:
return True
if num <= 1 or not num % 2:
return False
for div in range(3, int(math.sqrt(num) + 1), 2):
if not num % div:
return False
return True
def run_program(N):
total = 0
for i in range(N):
if is_prime(i):
total += 1
return total
if __name__ == "__main__":
N = 10000000
start = time.time()
total = run_program(N)
end = time.time()
print(f"1000W以内所有的素数是: {total}")
print(f"耗时: {end - start}s")
运行结果
1000W以内所有的素数是: 664579
耗时: 245.93426966667175s
小屌丝:好吧,这运行速度,确实有点… 小鱼:别灰心啊,我们不是还有Numba吗。
3.2 使用Numba
我们使用Numba,看看花费多长时间。 上代码
import math
import time
from numba import njit
@njit
def is_prime(num):
if num == 2:
return True
if num <= 1 or not num % 2:
return False
for div in range(3, int(math.sqrt(num) + 1), 2):
if not num % div:
return False
return True
@njit(parallel = True)
def run_program(N):
total = 0
for i in prange(N):
if is_prime(i):
total += 1
return total
if __name__ == "__main__":
N = 10000000
start = time.time()
total = run_program(N)
end = time.time()
print(f"1000W以内所有的素数是: {total}")
print(f"耗时: {end - start}s")
运行结果
1000W以内所有的素数是: 664579
耗时: 11.453454494476318s
total prime num is 664579
cost 5.30582857131958s
小屌丝:我的天啊, 这么神奇吗~ 小鱼:必须的。 小屌丝:鱼哥,鱼哥,它是怎么做到的?? 小鱼:嗯,我们来看看官方文档怎么解释的。
官方文档解释: 它读取装饰函数的 Python 字节码,并将其与有关函数输入参数类型的信息结合起来,分析和优化代码,最后使用编译器库(LLVM)针对你的 CPU 生成量身定制的机器代码。每次调用函数时,都会使用此编译版本,
小屌丝:原来如此…看来我今晚和小姐姐YYSX 是有戏了。 小鱼:就这点出息了!!!
4、总结
虽然Python是动态语言,有全局解释器锁,比其他静态语言要慢, 但是,通过今天小鱼分享的Numba,是不是把你心中那一团火又燃烧了。 说归说,闹归闹,官方文档最重要! 所以,关于更多的Numba的知识,还请异步到官方文档 倒数三个数,开始上链接,宝宝们准备好。 3 2 1
官网文档:http://numba.pydata.org/numba-doc/latest/index.html
|