IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> 机器学习数学语言(8.3作业) -> 正文阅读

[人工智能]机器学习数学语言(8.3作业)

1.决策表

  • 写出本例中的 U \mathbf{U} U, C \mathbf{C} C, D \mathbf{D} D V \mathbf{V} V 注: 最后两个属性为决策属性
    在这里插入图片描述
    U = { x 1 , x 2 , x 3 , x 4 , x 5 , x 6 , x 7 } \mathbf{U}=\{x_1, x_2, x_3, x_4, x_5, x_6, x_7\} U={x1?,x2?,x3?,x4?,x5?,x6?,x7?} is the set of instances,
    C = { Y e s , N o , H i g h , N o r m a l , L o w } \mathbf{C}=\{Yes,No,High,Normal,Low\} C={Yes,No,High,Normal,Low}
    D = { N o r m a l , A b n o m a l , Y e s , N o } \mathbf{D}=\{Normal,Abnomal,Yes,No\} D={Normal,Abnomal,Yes,No} is the set of decisional attributes,
    V = ? a ∈ C ∪ D V a \mathbf{V}=\bigcup_{a \in \mathbf{C} \cup \mathbf{D}}\mathbf{V_a} V=?aCD?Va?
    V a \mathbf{V_a} Va? is the domain of a ∈ C ∪ D a \in \mathbf{C} \cup \mathbf{D} aCD

  • 定义一个标签分布系统, 即各标签的值不是 [ 0 , 1 ] [0, 1] [0,1] 区间的实数, 且同一对象的标签和为 1.
    A Label Distribution system is a tuple S = ( X , Y ) S = (\mathbf X, \mathbf Y) S=(X,Y), where

  • X = [ x i j ] n × m ∈ R n × m \mathbf X = [x_{ij}]_{n \times m} \in \mathbb R^{n \times m} X=[xij?]n×m?Rn×m is the data matrix, and x i = [ x i 1 , … , x i m ] \mathbf{x}_i = [x_{i1}, \dots, x_{im}] xi?=[xi1?,,xim?]is an instance;

  • Y = [ y i k ] n × l ∈ [ 0 , 1 ] n × l \mathbf Y = [y_{ik}]_{n \times l} \in [0, 1]^{n \times l} Y=[yik?]n×l?[0,1]n×l is the lable matrix, and y i = [ y i 1 , … , y i l ] \mathbf{y}_i = [y_{i1}, \dots, y_{il}] yi?=[yi1?,,yil?]is the label vector of x i \mathbf{x}_i xi?
    satisfying

    • ? y i ? Y , ∑ t = 1 l y i t = 1 \forall \mathbf y_i \subset \mathbf Y, \sum_{t = 1}^{l}y_{it} = 1 ?yi??Y,t=1l?yit?=1.
  • n n n is the number of instances;

  • m m m is the number of features;

  • l l l is the number of distribution labels.

示例讲解

(1). ∑ i = 1 m ( y ^ ? y i ) 2 \sum_{i=1}^{m} \left ( \hat{y} - y_{i}\right )^2 i=1m?(y^??yi?)2
其中, y ^ \hat{y} y^? 表示 x x x 通过含 θ 1 ° \theta_{1}^{\circ} θ1°? θ 2 ° \theta_{2}^{\circ} θ2°?? 这两个参数的式子求得, y i y_{i} yi? 表示实际的 x x x 对应的值, ( y ^ ? y i ) 2 \left(\hat{y} - y_{i}\right )^2 (y^??yi?)2 是求对应同一个 x x x, 预测值和实际值的差距,即误差,该值越大,说明误差越大,前面的 ∑ i = 1 m \sum_{i=1}^{m} i=1m? 求和符号表示,每一个例子的误差之和。整个式子就是求预测值和实际值的误差和,针对所有的例子。

(2). Θ 1 = Θ 0 ? α × ? f ( Θ ) ∣ Θ 0 \Theta^1=\Theta^0-\alpha \times \nabla f\left ( \Theta \right )|\Theta ^0 Θ1=Θ0?α×?f(Θ)Θ0

(3). Θ 2 = Θ 1 ? α × ? f ( Θ ) ∣ Θ 1 \Theta^2=\Theta^1-\alpha \times \nabla f\left ( \Theta \right )|\Theta ^1 Θ2=Θ1?α×?f(Θ)Θ1
其中(2), (3)都是相同的意思,都是为了找最小的 Θ ( θ 1 , θ 2 ) \Theta(\theta_{1},\theta_{2}) Θ(θ1?,θ2?)
对于(2), Θ 0 \Theta_{0} Θ0? 表示储存一组参数 ( θ 1 0 , θ 2 0 ) (\theta_{1}^{0},\theta_{2}^{0}) (θ10?,θ20?), α \alpha α是一个常数,主要是记录 Θ 0 \Theta^0 Θ0 Θ 1 \Theta^1 Θ1 的方向, α \alpha α很小, ? f ( Θ ) ∣ Θ 0 \nabla f\left ( \Theta \right )|\Theta ^0 ?f(Θ)Θ0 是在 Θ 0 \Theta_{0} Θ0? 这点的导函数所对应的值。式子最终的目的就是求 Θ 1 \Theta_{1} Θ1?, 根据这个式子迭代,就可以一点一点逼近最小的 Θ ( θ 1 , θ 2 ) \Theta(\theta_{1},\theta_{2}) Θ(θ1?,θ2?).

(4). f ( Θ ) = 1 2 m ( X ? Θ ? Y ) T ( X ? Θ ? Y ) f(\Theta)=\frac{1}{2m}\left ( \mathbf{X}\cdot\Theta-\mathbf{Y} \right )^\mathbf{T}\left ( \mathbf{X}\cdot\Theta-\mathbf{Y} \right ) f(Θ)=2m1?(X?Θ?Y)T(X?Θ?Y)
由文章上文知道: X = [ x 1 1 x 2 1 ? ? x 20 1 ] \mathbf{X}=\begin{bmatrix} x_1 & 1 \\ x_2 & 1 \\ \vdots & \vdots \\ x_{20} & 1 \end{bmatrix} X=??????x1?x2??x20??11?1??????? , Θ = [ θ 1 θ 2 ] \mathbf{\Theta }=\begin{bmatrix} \theta_1 \\ \theta_2 \end{bmatrix} Θ=[θ1?θ2??], Y = [ y 1 y 2 ? y 20 ] \mathbf{Y}=\begin{bmatrix} y_1\\ y_2 \\ \vdots \\y_{20} \end{bmatrix} Y=??????y1?y2??y20????????
其中, X ? Θ ? Y \mathbf{X}\cdot\Theta-\mathbf{Y} X?Θ?Y 的结果是一个 20 × 1 20\times1 20×1的矩阵(该文章上有20个例子),每一项表示对应的 x x x y ^ ? y \hat{y}-y y^??y ( X ? Θ ? Y ) T ( X ? Θ ? Y ) \left ( \mathbf{X}\cdot\Theta-\mathbf{Y} \right )^\mathbf{T}\left ( \mathbf{X}\cdot\Theta-\mathbf{Y} \right ) (X?Θ?Y)T(X?Θ?Y)的结果是一个数,这个数是 ∑ i = 1 m ( y ^ ? y i ) 2 \sum_{i=1}^{m} \left ( \hat{y} - y_{i}\right )^2 i=1m?(y^??yi?)2 1 m \frac{1}{m} m1?是表示平均到每一份上, 1 2 \frac{1}{2} 21? 是为了后续求导时不再有多余的常量(根据文章里说的)。
(4) 式表示损失函数。
(5). ? f ( Θ ) = 1 m X T ( X ? Θ ? Y ) \nabla{f}(\Theta)=\frac{1}{m} \mathbf{X}^{\mathbf{T}}\left ( \mathbf{X}\cdot \Theta -\mathbf{Y} \right ) ?f(Θ)=m1?XT(X?Θ?Y) 是(4)式的导函数,当导函数在某处可导且为0时,该点的 Θ \Theta Θ值就是最小的值。

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2021-08-08 11:20:38  更:2021-08-08 11:22:02 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2025年1日历 -2025/1/12 3:52:55-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码