IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> 西湖大学自然语言处理(十一)—— 分类 -> 正文阅读

[人工智能]西湖大学自然语言处理(十一)—— 分类

分类和聚类

在这里插入图片描述
在这里插入图片描述

聚类分类
核心将数据分成簇从已经分组好的数据中训练得出目标函数,把新数据放到已经分好的组中
学习类型无监督学习有监督学习
典型算法K-means,DBSCAN ,层次聚类,光谱聚类决策树,贝叶斯,逻辑回归
算法输出聚类结果并不确定,不一定能够反映数据的真实分类,同样的聚类,对于不同的需求,可能好也可能坏分类结果是确定的,分类的优劣是客观的,不根据业务或算法需求而定

聚类(无监督学习)

  • 不需要手工标注的训练数据
  • 文档中所有单词都具有同等的重要性
  • 很难保证固定的向量划分

分类(有监督学习)

  • 需要手工标注的训练数据
  • 对于分类任务挑选重要的单词
  • 使用模型参数来定义空间划分

Support Vector Machine(SVM)

Linear separability(线性可分性)

超平面:高维向量空间中的线性形状

  • 2维空间:线
  • 3维空间:面
  • 多维空间:超平面

线性可分:标记点具有超平面来分离边界

线性分类器:准确性和复杂性之间的平衡

  • 支持向量机
  • 感知机

SVM模型的定义

在这里插入图片描述
定义:向量空间中二元分类的线性模型
支持向量的定义:距离分类的超平面最近的标记点
距离的定义:支持向量与超平面之间的距离
训练目标:寻找最大化距离的超平面

SVM建模

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
对于任何一个支持向量而言,SVM要求 ∣ w ? T v ? ( x i ) + b ∣ = 1 |\vec{w}^T\vec{v}(x_i)+b| = 1 w Tv (xi?)+b=1,这样可以使计算变得简便
在这里插入图片描述
约束条件可以这样理解:对于任何一个训练样本而言,它到超平面的距离都要大于等于边际距离
在这里插入图片描述

Perceptron(感知机)

The perceptron algorithm

在这里插入图片描述
在这里插入图片描述

Perceptron update

在这里插入图片描述

Numerical Interpretation(代数解释)

在这里插入图片描述

SVM和感知机区别

在这里插入图片描述
Batch learning是针对整个训练集而言来训练的,简称批学习
Online learning是对每个样本迭代更新参数

多分类问题

如何把二分类问题应用到多分类问题上?

两种思路:

  • 将所有样本分成1类和其他类
  • 针对每一组couple,训练一个分类器,判断样本属于哪一类
    在这里插入图片描述
    在这里插入图片描述
    正负样本的引入

Output-based features

在这里插入图片描述
在这里插入图片描述

Multi-class SVM

在这里插入图片描述
在这里插入图片描述

Multi-class perceptron

在这里插入图片描述
在这里插入图片描述

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2022-04-06 16:17:41  更:2022-04-06 16:18:04 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/26 11:42:08-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码