IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> 机器学习logistic回归 -> 正文阅读

[人工智能]机器学习logistic回归


一、最优化算法与回归介绍

最优化算法的体现:生活中遇到过很多最优化问题,例如从怎么A走到B耗时最短,如何配比调料才能做出好菜,可见最优化的作用是很大的。
回归:假设现在有一些数据点,我们用一条直线对这些点进行拟合,这个拟合过程就称作回归。

二、logistic回归的一般过程

  1. 收集数据:采用任意方式收集数据。
  2. 准备数据:数据类型为数值型,最好将其预处理为结构化数据格式。
  3. 分析数据:采用任意方法对数据进行分析。
  4. 训练算法:大部分时间将用于训练,训练的目的是为了找到最佳的分类回归系数。
  5. 测试算法:一旦训练步骤完成,分类将会很快。
  6. 使用算法:首先,我们需要输入一些数据,并将其转换成对应的结构化数值;接着,基于训练好的回归系数就可以对这些数值进行简单的回归运算,判定他们属于哪个类别;在这之后,我们就可以在输出的类别上做一些其他分析工作。

三、线性回归与对数线性回归

线性回归模型和对数线性回归模型是为了确定基于最优化方法的最佳回归系数。

线性回归

线性模型的一般形式为:
f ( x ) = w 1 x 1 + w 2 x 2 + . . . + w d x d + b f ( x )= w_{1}x_{}1+w_{2}x_{2}+...+w_{d}x_{d} + b f(x)=w1?x?1+w2?x2?+...+wd?xd?+b
其中x=(x1, x2, …, xd)是由d维属性描述的样本,其中 xi是 x 在第 i 个属性上的取值。
线性回归的目的:学习一个线性模型以尽可能准确地预测实值输出标记:
f ( x ) = w x i + b f(x)=wx_{i}+b f(x)=wxi?+b
使得
f ( x i ) ? y i f(x_{i})\simeq y_{i} f(xi?)?yi?

对数线性回归

y = g ( x ) = e z y=g(x)=e^{z} y=g(x)=ez,z=wx+b,两边求对数,就可以得到对数线性回归模型:
l n y = w x + b lny=wx+b lny=wx+b

四、最小二乘法

如上所述,使用线性回归模型来预测样本的值,这其中必然不可能百分百与样本值重合,故此,我们引入最小二乘法来约束:回归直线应满足全部观测值与对应的回归估计值的误差平方和最小。用最小二乘法来计算,推导过程如下:
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

五、sigmoid函数

我们想要的函数应该是,能接受所有的输入然后预测出类别。例如,在两个类的情况下只有0和1.单位跃迁函数可以做到这一点,但是它也有一个问题:在跳跃点上从0瞬间跳跃到1,这个瞬间有时很难处理。而sigmoid函数则更加容易。sigmoid函数的公式如下:
σ ( x ) = 1 1 + e ? x \sigma (x)=\frac{1}{1+e^{-x}} σ(x)=1+e?x1?
在这里插入图片描述
当x=0时,sigmoid函数值为0.5,随着x的增大或减小,sigmoid函数分别趋近于0和1,已经很接近跃迁函数了。因此,为了实现logistic分类器,我们可以在每个特征上都乘以一个回归系数,然后把所有的结果相加,将结果带入到sigmoid函数中,大于0.5的值分类为1,小于则分类为0.这样就将线性回归模型和sigmoid函数结合在了一起。
现在的问题变成了:最佳回归系数是多少?


六、梯度上升法

梯度上升发基于的思想是:要找到某函数的最大值,最好的方法是沿着该函数的梯度方向探寻。如果梯度记为 ▽ \triangledown ,则函数f(x,y)的梯度由下式表示:

在这里插入图片描述
这个梯度意味着要沿x的方向移动 ? f ( x , y ) ? x \frac{\partial f(x,y)}{\partial x} ?x?f(x,y)?,沿y的方向移动 ? f ( x , y ) ? y \frac{\partial f(x,y)}{\partial y} ?y?f(x,y)?
梯度上升算法到达每个点后都会重新估计移动的方向。从p0开始,计算完该点的梯度,函数就根据梯度移动到下一点p1。在p1点,梯度再次被重新计算,并沿新的梯度方向移动到p2.如此循环迭代,直到满足停止条件。迭代过程中,梯度算子总是保证我们能选取到最佳的移动方向。
在这里插入图片描述
梯度上升算法的迭代公式如下:
w : = w + α ▽ w f ( w ) w:=w+\alpha \bigtriangledown w f(w) w:=w+αwf(w)

七、训练算法

def loadDataSet():      # 打开testSet文件并读取,前两列为特征x1和x2,最后一列为类别标签
    dataMat = []
    labelMat = []
    fr = open("testSet.txt")
    for line in fr.readlines():
        lineArr = line.strip().split()
        dataMat.append([1.0, float(lineArr[0]), float(lineArr[1])])
        labelMat.append(int(lineArr[2]))
    return dataMat, labelMat


def sigmoid(inX):       # 分类函数
    return 1.0 / (1 + exp(-inX))


def gradAscent(dataMatIn, classLabels):     # 梯度上升寻找最佳参数w
    dataMatrix = mat(dataMatIn)
    labelMat = mat(classLabels).transpose()     # 类别标签矩阵转置
    m, n = shape(dataMatrix)
    alpha = 0.001   # 步长
    maxCycles = 500     # 迭代次数
    weights = ones((n, 1))
    for k in range(maxCycles):
        h = sigmoid(dataMatrix * weights)       # sigmoid函数计算出预测值
        error = (labelMat - h)      # 计算真是类别和预测类别的差值
        weights = weights + alpha * dataMatrix.transpose() * error      #梯度上升公式,将100*3的dataMatrix转置后与100*1的error相乘
    return weights      # 返回回归系数

运行结果为系数矩阵:

在这里插入图片描述

八、画出决策边界

def plotBestFit(weights):       # 画出数据集和logistic回归最佳拟合直线

    dataMat, labelMat =loadDataSet()
    dataArr=array(dataMat)
    n=shape(dataArr)[0]
    xcord1=[]
    ycord1=[]
    xcord2=[]
    ycord2=[]
    for i in range(n):
        if int(labelMat[i])==1:
            xcord1.append(dataArr[i,1])
            ycord1.append(dataArr[i,2])
        else:
            xcord2.append(dataArr[i,1])
            ycord2.append(dataArr[i,2])
    fig=plt.figure()        # 创建自定义图像
    ax=fig.add_subplot(111)     # 画子图函数
    ax.scatter(xcord1,ycord1,s=30,c="red",marker="s")   # 绘制散点图
    ax.scatter(xcord2,ycord2,s=30,c="green")
    x=arange(-3.0,3.0,0.1)      # 创建等差数组
    y=(-weights[0]-weights[1]*x)/weights[2]
    ax.plot(x,y)
    plt.xlabel("X1")
    plt.ylabel("X2")
    plt.show()

在这里插入图片描述

九、随机梯度上升算法及改进

def stocGradAscent(dataMatrix,classLabels):     # 随机梯度上升算法
    m,n=shape(dataMatrix)
    alpha=0.01
    weights=ones(n)
    for i in range(m):
        h=sigmoid(sum(dataMatrix[i]*weights))
        error=classLabels[i]-h
        weights=weights+alpha*error*dataMatrix[i]
    return weights

在这里插入图片描述
在这里插入图片描述
可以发现gradAscent函数和stocGradAscent函数的梯度上升算法很相似,但有区别。前者的error计算出的是向量,后者是数值,并且后者没有矩阵转换的过程。
拟合出来的直线也并不像梯度上升的效果那样好,这归咎于迭代次数的差距。

改进的随机梯度上升算法

def stocGradAscent1(dataMatrix,classLabels,numIter=1500):   # 改进的随机梯度上升算法
    m,n=shape(dataMatrix)
    weights=ones(n)
    for j in range(numIter):
        dataIndex=list(range(m))
        for i in range(m):
            alpha=4/(1.0+j+i)+0.01
            randIndex=int(random.uniform(0, len(dataIndex)))
            h=sigmoid(sum(dataMatrix[randIndex]*weights))
            error=classLabels[randIndex]-h
            weights=weights+alpha*error*dataMatrix[randIndex]
            del(dataIndex[randIndex])
    return weights

在这里插入图片描述
在这里插入图片描述

  1. 改进后的算法将每次迭代的步长设置为随着迭代次数不断减小。
  2. 这里通过随机选取样本来更新回归系数。这种方法将减少周期性的波动。

十、logistic回归预测病马死亡率

训练数据:在这里插入图片描述
测试数据:
在这里插入图片描述
分类代码:

def classifyVector(inX,weights):    # 分类0和1
    prob=sigmoid(sum(inX*weights))
    if prob >0.5:
        return 1.0
    else:
        return 0.0

def colicTest():        # logistic分类测试函数
    frTrain=open("horseColicTraining.txt")
    frTest=open("horseColicTest.txt")
    trainingSet=[]
    trainingLabels=[]
    for line in frTrain.readlines():
        currLine=line.strip().split("\t")
        lineArr=[]
        for i in range(21):
            lineArr.append(float(currLine[i]))
        trainingSet.append(lineArr)
        trainingLabels.append(float(currLine[21]))
    trainWeights=stocGradAscent1(array(trainingSet),trainingLabels,500)
    errorCount=0
    numTestVec=0.0
    for line in frTest.readlines():
        numTestVec+=1.0
        currLine=line.strip().split("\t")
        lineArr=[]
        for i in range(21):
            lineArr.append(float(currLine[i]))
        if int(classifyVector(array(lineArr),trainWeights)!=int(currLine[21])):
            errorCount+=1
    errorRate=float(errorCount)/numTestVec
    print("the error rate of this test is: %f" %errorRate)
    return errorRate

def multiTest():
    numTests=10
    errorSum=0.0
    for k in range(numTests):
        errorSum+=colicTest()
    print("after %d iterations the average error rate is: %f" %(numTests,errorSum/float(numTests)))

在这里插入图片描述
在更改迭代次数后平均错误率没有明显变化,但是在某次迭代中可以看见错误率降低到20%的情况。
在这里插入图片描述

总结

logistic回归进行分类的优点是代价不高,易于理解和实现。但容易欠拟合,所以分类精度很难降下来,且对数据的预处理方面,需要先剔除坏的数据,拓展到大量的数据时,这是一个很大的问题。

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2021-11-22 12:20:40  更:2021-11-22 12:21:51 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2025年1日历 -2025/1/11 5:10:09-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码