室内外图片进行logistic分类
思路:首先裁剪图片至指定大小,使用cv2.calcHist方法对图片进行颜色直方图统计,获取已知图片的颜色分布。构造代价函数(costFunction)以及梯度函数(gradient),使用opt.fmin_tnc最小化函数获得最小代价,以及得到theta值。在提取需要分离的图片进行颜色直方图统计,根据theta计算得出为室内或室外图片。 注意:这里颜色直方图获取的是r、g、b三个颜色通道在0-255上的颜色统计,也就是这里一共有3*256= 768个特征
主要代码:
#求取图片特征,以颜色直方图为特征
def data_cope(path,hist_arr):
if os.path.isdir(path):
for child in os.listdir(path):
if child.find('.jpg') > 0:
image = cv2.imread(path + child)
image = cv2.resize(image,(372,216)) #裁剪图片成为指定大小
hist_set = np.array([],dtype=np.longdouble).reshape(0,1)
for i in range(3):
hist = cv2.calcHist([image], [i], None, [256], [0.0, 256.0]) #rgb颜色直方图
hist_set = np.vstack((hist_set,hist))
if (path == './train_data/indoor/'): #归类,1为室内图,0为室外图
hist_set = np.vstack((hist_set, [[1]]))
elif (path == './train_data/outdoor/'):
hist_set = np.vstack((hist_set, [[0]]))
hist_arr = np.vstack((hist_arr,hist_set.T))
return hist_arr
#sigmoid函数
def sigmoid(z):
s = 1.0/(1.0 + np.exp(-z))
return s
#代价函数
def costFunction(theta,X,y):
m = len(y)
h = sigmoid(np.dot(X, theta))
J = (np.dot(np.transpose(-y), np.log(h)) - np.dot(np.transpose(1 - y), np.log(1 - h))) / m
return J
#梯度计算函数
def gradient(theta,X,y):
m = len(y)
h = sigmoid(np.dot(X, theta))
grad = X.T.dot((h - y)) / m
return grad
#求取theta
result = opt.fmin_tnc(func=costFunction, x0=theta, fprime=gradient, args=(X, y), approx_grad = True) #最小化函数
theta_result = result[0]
|