二分分类的定义

输出为对或错，是或否等，即用1和0表示，在二分分类的问题中，我们的最终目标是训练出一个分类器classifier，如下图为例，它以图片的特征向量x为输入，预测输出的结果标签y是1还是0。

样本集的建立

对于每一个样本的输入向量x，最好建立成列向量。对于很多样本构成的样本集矩阵，应该是按照列向量堆叠的形式构成，这样的约定规则会使构建过程简单很多。用shape可以查看他们的维度。

?根据机器学习的线性回归，可以用上式预测y的值，但预测的值可能大于1，或者小于0，这样的概率没有意义，与我们的期望值0~1之间是不相符的，我们需要对输出的范围进行限制。

在外层嵌套sigmoid函数，利用sigmoid函数的性质：

误差函数用于衡量预测的准确性。如果用误差平方公式可能会有很多局部最优，用第二种形式的误差函数可以很好解决。误差函数越小越好。

成本函数用于衡量参数w，b在训练集上的效果。?在训练logistic regression时，应该选择合适的参数w，b让成本函数J尽可能地小。

从初始点（一般选取0；随机初始点也可以，但是通常不这么做；从任意点出发，最终应该下降到同一个点）出发，按照梯度最大方向走，到最低点。

?分为前向传播和后向传播两个过程。根据前向传播计算出当前参数的误差函数，再由误差函数进行后向传播去重新优化参数（梯度下降），不断重复这两个过程，最终参数会收敛到我们想要的结果。

加:2022-01-16 13:03:28 更:2022-01-16 13:05:55

-2026/3/10 6:00:35-

网站联系: qq:121756557 email:121756557@qq.com IT数码