感知机
感知机接收多个输入信号,输出一个信号
下图所示是一个接收两个输入信号的感知机的例子。x1、x2是输入信号,y是输出信号,w1、w2是权重(w是weight的首字母)。图中的○称为“神经元”或者“节点”。输入信号被送往神经元时,会被分别乘以固定的权重(w1x1、w2x2)。神经元会计算传送过来的信号的总和,只有当这个总和超过了某个界限值时,才会输出1。这也称为“神经元被激活”。这里将这个界限值称为阈值,用符号θ表示。
数学公式表达上式就是:
感知机的多个输入信号都有各自固有的权重,这些权重发挥着控制各个信号的重要性的作用。也就是说,权重越大,对应该权重的信号的重要性就越高
感知机的实现
简单实现
def AND(x1,x2):
w1,w2,theta = 0.5,0.5,0.7
tmp = x1*w1+x2*w2
if tmp <= theta:
return 0
else:
return 1
print(AND(0,0))
print(AND(1,0))
print(AND(0,1))
print(AND(1,1))
0
0
0
1
导入权重和偏置值
式(感知机-01)的θ换成?b,b称为偏置,w1和w2称为权重,于是就可以用式(感知机-02)来表示感知机的行为:
使用numpy,实现上式的感知机
import numpy as np
def AND(x1,x2):
x = np.array([x1,x2])
w = np.array([0.5,0.5])
b = -0.7
tmp = np.sum(w*x) + b
if tmp<=0:
return 0
else:
return 1
print(AND(0,0))
print(AND(1,0))
print(AND(0,1))
print(AND(1,1))
0
0
0
1
需要注意的是: 偏置和权重w1、w2的作用是不一样的。具体地说,w1和w2是控制输入信号的重要性的参数,而偏置是调整神经元被激活的容易程度(输出信号为1的程度)的参数。比如,若b为?0.1,则只要输入信号的加权总和超过0.1,神经元就会被激活。但是如果b为?20.0,则输入信号的加权总和必须超过20.0,神经元才会被激活。像这样,偏置的值决定了神经元被激活的容易程度。
感知机的局限性
或门结果,可以找到区分输出结果的直线:
异或门输出结果,可以看到找不到一条直线能够区分输出的结果
使用曲线分割:
由上面的图可知,感知机的局限性就在于它只能表示由一条直线分割的空间。图 异或门(曲线分割)这样弯曲的曲线无法用感知机表示
多层感知机
感知机不能表示异或门让人深感遗憾,实际上,感知机的绝妙之处在于它可以“叠加层”,下面探讨通过叠加层来表示异或门
通过已有门路组合实现异或门
首先是各门路真值表: 与门:
与非门:
或门:
与门、与非门、或门符号:
所以,异或门可以通过下图所示的配置来实现。这里,x1和x2表示输入信号,y表示输出信号。x1和x2是与非门和或门的输入,而与非门和或门的输出(s1、s2)则是与门的输入
通过组合不同门路实现的异或门真值表如下:
组合门路异或门的实现
def AND(x1,x2):
x = np.array([x1,x2])
w = np.array([0.5,0.5])
b = -0.7
tmp = np.sum(w*x) + b
if tmp<=0:
return 0
else:
return 1
def NAND(x1,x2):
x = np.array([x1,x2])
w = np.array([-0.5,-0.5])
b = 0.7
tmp = np.sum(w*x) + b
if tmp<=0:
return 0
else:
return 1
def OR(x1,x2):
x = np.array([x1,x2])
w = np.array([0.5,0.5])
b = -0.2
tmp = np.sum(w*x) + b
if tmp<=0:
return 0
else:
return 1
def XOR(x1,x2):
s1 = NAND(x1,x2)
s2 = OR(x1,x2)
y = AND(s1,s2)
return y
print(XOR(0,0))
print(XOR(0,1))
print(XOR(1,0))
print(XOR(1,1))
0
1
1
0
与门、或门是单层感知机,而异或门是2层感知机。叠加了多层的感知机也称为多层感知机 异或门的感知机如下图所示:
上面的感知机总共由 3层构成,但是因为拥有权重的层实质上只有 2层(第 0层和第 1层之间,第 1层和第 2层之间),所以称为“2层感知机”
|