| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 人工智能 -> 机器学习、人工智能、大数据学习中笔记 -> 正文阅读 |
|
[人工智能]机器学习、人工智能、大数据学习中笔记 |
机器学习、人工智能、大数据学习中笔记学习中记得一些笔记:来源:李沐老师《动手学习深度学习_pytorch版本》、李航老师《统计学习方法》、葫芦娃《百面机器学习》《百面深度学习》、网络各种资料。现在是在做笔记,待做完以后再重新整理归类。实时更新。 代码实现CrossEntropyLoss
o
j
o_j
oj?为为归一化预测的
o
o
o的第
j
j
j个元素。 实现nn.seqential
验证
输出:
这里需要注意nn.ReLU 和F.ReLU的区别。 机器学习准确率(Accuracy)精准率(Precision)召回率(Recall)均方根误差(RMSE)区别和局限
生成方法和判别方法区别判别方法:数据直接学习决策函数f(x)或者条件概率分布
p
(
y
∣
x
)
p(y|x)
p(y∣x)作为预测模型。该方法关心给定输入x,应该预测什么样的输出y。(KNN、感知机、决策树、逻辑斯蒂回归、SVM等) 过拟合应该如何处理两种方法:
对于类别数据应该如何处理常用的三种方法:
除此以外还有Helmert Contrast、Sum Contrast、Polynomial Contrast等。 KL散度是什么又称相对熵、是衡量相同空间中两个概率分布相对差距的测度。两个概率 p ( x ) p(x) p(x)和 q ( x ) q(x) q(x)的KL散度为: D ( p ∣ ∣ q ) = ∑ x ∈ X p ( x ) l o g p ( x ) q ( x ) D(p||q)=\sum_{x\in X}p(x)log\frac{p(x)}{q(x)}\quad D(p∣∣q)=x∈X∑?p(x)logq(x)p(x)? 交叉熵是什么、用于衡量估计模型和真是概率分布之间的差异。 人工智能、机器学习、深度学习区别人工智能泛指让机器具有人的智力的技术。 特征工程是什么对原始数据进行处理将其提炼为特征。从本质上讲特征工程是一个表现和展示数据的过程。实际工作生产中,特征工程指的是去除原始数据中的杂质和冗余。 为什么要做归一化、哪些类型数据需要做是各个特征之间具有可比性(统一量纲)。使模型能够更容易通过梯度下降找到最优解。 主要方法有线性归一化。
决策树不需要归一化因为其计算的是信息增益比,信息增益比和特征是否归一化无关。 归一化和标准化区别归一化会改变数据的原始距离、分布和信息。标准化不会。 深度学习深度学习优势能够处理人们并不完全懂得问题,也更加擅长处理含噪声或不完全的数据。 卷积网络什么是感受野、怎样计算感受野对于某层输出特征图上某个点,在卷积网络的原始输入数据上能够影响到这个点的取值的区域。 一维卷积是什么普通卷积可以转化为矩阵乘法。 卷积网络变种有哪些
卷积网络和全连接层的区别MLP是输出层每个节点于输入层每个节点都有连接。
卷积神经网络基本操作自然语言处理自然语言中如何计算交叉熵
H
(
L
,
q
)
=
?
lim
?
n
→
∞
1
n
∑
x
1
n
p
(
x
1
n
)
l
o
g
q
(
x
1
n
)
H(L,q)=-\lim_{n \to \infty}\frac{1}{n}\quad\sum_{x_1^n}p(x_1^n)logq(x_1^n)
H(L,q)=?n→∞lim?n1?x1n?∑?p(x1n?)logq(x1n?) 困惑度在设计语言模型是通常使用困惑度代替交叉熵衡量语言模型好坏。给定语言L的样本
l
1
n
=
l
1
,
l
2
,
…
,
l
n
l_1^n=l_1,l_2,\ldots,l_n
l1n?=l1?,l2?,…,ln? TF-IDF
T
F
?
I
D
F
(
t
,
d
)
=
T
F
(
t
,
d
)
×
I
D
F
(
t
)
TF-IDF(t,d)=TF(t,d)\times IDF(t)
TF?IDF(t,d)=TF(t,d)×IDF(t) I D F ( t ) = l o g 文 章 总 数 包 含 单 词 t 的 文 章 总 数 + 1 IDF(t)=log\frac{文章总数}{包含单词t的文章总数+1}\quad IDF(t)=log包含单词t的文章总数+1文章总数? |
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2025年1日历 | -2025/1/10 21:29:40- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |