二分类
1. 计算机的图存储
计算机对图像的存储是用RGB三个矩阵实现的,在实现过程中,用一个非常长的向量来表示列出。对于下面这张图而言,如果我们的图像矩阵是
64
×
64
64\times64
64×64,那么最终的图像存储的维度将是
64
×
64
×
3
=
12288
64\times64\times3=12288
64×64×3=12288,这里用
n
=
n
x
=
12288
n=n_x=12288
n=nx?=12288来表示向量的维度。
二分分类的目的:对于输入的向量,输出0/1的结果。比如现在这张输入的图,输出0/1表示这张图表示的是否是猫
2. 问题中常用的数据字母表示
线性回归
1. 符号定义、代价函数与梯度下降法
2. 一些技巧
- 特征缩放时候尽量让所有的特征
x
i
x_i
xi?的范围保持在
?
1
≤
x
i
≤
1
-1\le x_i\le 1
?1≤xi?≤1
- 可以绘制
m
i
n
(
J
(
θ
)
)
min(J_{(\theta)})
min(J(θ)?)与迭代次数
N
o
No
No的图像,用来确保梯度下降
3. 多项式回归的应用
logistics回归算法
logistic回归算法多运用于二分类问题上,即y是离散的情况。
下面的笔记包含了三部分内容
- 什么是分类问题
- 分类问题的具体实现(利用decision boundary
?
\Rightarrow
?从数据集中计算得到)
- 多分类问题的应用(选取其中的一个为一类,剩余的为另一类,依次计算得到boundary。对于不同的boundary得到的值取
m
a
x
(
h
θ
)
max(h_{\theta})
max(hθ?)为结果,判断y是0/1)
1. 什么是分类问题
2. 分类问题的具体实现
利用decision boundary
?
\Rightarrow
?从数据集中计算得到 设置阈值,对于计算得到的
h
θ
h_{\theta}
hθ?的值进行划分:
3. 多分类问题的应用
- 选取其中的一个为一类,剩余的为另一类,依次计算得到boundary。
- 对于不同的boundary得到的值取
m
a
x
(
h
θ
)
max(h_{\theta})
max(hθ?)为结果,判断y是0/1
|