IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> 核方法 Kernel method -> 正文阅读

[人工智能]核方法 Kernel method

1.内积(点积)

内积,又叫做点积,数量积或标量积。假设存在两个向量 a = [ a 1 , a 2 , . . . , a n ] a=[a_{1}, a_{2}, ..., a_{n}] a=[a1?,a2?,...,an?] b = [ b 1 , b 2 , . . . , b n ] b=[b_{1},b_{2},...,b_{n}] b=[b1?,b2?,...,bn?],内积的计算方法为:
a ? b = a 1 b 1 + a 2 b 2 + ? + a n b n a\cdot b= a_{1}b_{1}+a_{2}b_{2}+\cdots +a_{n}b_{n} a?b=a1?b1?+a2?b2?+?+an?bn?

2.核方法 1

核方法的主要思想是基于这样一个假设:“在低维空间中不能线性分割的点集,通过转化为高维空间中的点集时,很有可能变为线性可分的” ,例如有两类数据,一类为 x < a ∪ x > b x<a\cup x>b x<ax>b;另一部分为 a < x < b a<x<b a<x<b。要想在一维空间上线性分开是不可能的。然而我们可以通过F(x)=(x-a)(x-b)把一维空间上的点转化到二维空间上,这样就可以划分两类数据 F ( x ) > 0 F(x)>0 F(x)>0 F ( x ) < 0 F(x)<0 F(x)<0;从而实现线性分割。如下图所示:
图1

定义一个核函数 K ( x 1 , x 2 ) = ? ? ( x 1 ) , ? ( x 2 ) ? K(x_{1},x_{2})=\left \langle \phi (x_{1}),\phi (x_{2})\right \rangle K(x1?,x2?)=??(x1?),?(x2?)?, 其中 x 1 x_{1} x1? x 2 x_{2} x2?是低维度空间中的点(在这里可以是标量,也可以是向量), ? ( x i ) \phi (x_{i}) ?(xi?)是低维度空间的点转化为高维度空间中的点的表示, ? , ? \left \langle ,\right \rangle ?,?表示向量的内积。这里核函数的表达方式一般都不会显式地写为内积的形式,即我们不关心高维度空间的形式。
这里有个很重要的问题,就是我们为什么要关心内积。一般的我们可以把分类或回归问题分为两类:参数学习和基于实例的学习。参数学习就是通过一堆训练数据把模型的参数学习出来,训练完成之后训练数据就没有用了,新数据使用已经训练好的模型进行预测,例如人工神经网络。而基于实例的学习(又叫基于内存的学习)是在预测的时候会使用训练数据,例如KNN算法,会计算新样本与训练样本的相似度。计算相似度一般通过向量的内积来表示。从这里可以看出,核方法不是万能的,它一般只针对基于实例的学习。

3.核方法的定义和例子2

给定一个映射关系 ? \phi ?,我们定义相应的核函数为:
K ( x , y ) = ? ( x ) T ? ( y ) K(x,y)=\phi (x)^{T}\phi (y) K(x,y)=?(x)T?(y)
则内积运算 < ? ( x ) , ? ( y ) > <\phi (x), \phi (y)> <?(x),?(y)>可以用核 K ( x , y ) K(x,y) K(x,y)来表示。

例如,给定两个 n n n维向量 x x x y y y x , y ∈ R n x,y\in \mathbb{R}^{n} x,yRn,我们定义一个核函数 K ( x , y ) = ( x T y ) 2 K(x,y)=(x^{T}y)^{2} K(x,y)=(xTy)2,将该二次多项式展开会得到如下表达式: ( x 1 y 1 + . . . + x n y n ) 2 (x_{1}y_{1}+...+x_{n}y_{n})^{2} (x1?y1?+...+xn?yn?)2
K ( x , y ) K(x,y) K(x,y)还可以写成:
KaTeX parse error: No such environment: align at position 8: \begin{?a?l?i?g?n?}? K(x,y)&=(x^{T}…
如果 n n n为2的话,即 x T = ( x 1 , x 2 ) x^{T}=(x_{1},x_{2}) xT=(x1?,x2?) y T = ( y 1 , y 2 ) y^{T}=(y_{1},y_{2}) yT=(y1?,y2?)。若直接对 ( x T y ) 2 (x^{T}y)^{2} (xTy)2进行计算
( x T y ) 2 = ( x 1 y 1 + x 2 y 2 ) 2 = ( x 1 y 1 ) 2 + 2 x 1 y 1 x 2 y 2 + ( x 2 y 2 ) 2 (x^{T}y)^{2}=(x_{1}y_{1}+x_{2}y_{2})^{2}=(x_{1}y_{1})^{2}+2x_{1}y_{1}x_{2}y_{2}+(x_{2}y_{2})^{2} (xTy)2=(x1?y1?+x2?y2?)2=(x1?y1?)2+2x1?y1?x2?y2?+(x2?y2?)2
如果我们先对 x x x y y y进行映射, ? ( x ) \phi(x) ?(x)可以将 x x x映射为:
? ( x ) = [ x 1 x 1 x 1 x 2 x 2 x 1 x 2 x 2 ] \phi (x)=\begin{bmatrix} x_{1}x_{1}\\ x_{1}x_{2}\\ x_{2}x_{1}\\ x_{2}x_{2}\\ \end{bmatrix} ?(x)=?????x1?x1?x1?x2?x2?x1?x2?x2???????
? ( y ) \phi(y) ?(y)可以将 y y y映射为:
? ( y ) = [ y 1 y 1 y 1 y 2 y 2 y 1 y 2 y 2 ] \phi (y)=\begin{bmatrix} y_{1}y_{1}\\ y_{1}y_{2}\\ y_{2}y_{1}\\ y_{2}y_{2}\\ \end{bmatrix} ?(y)=?????y1?y1?y1?y2?y2?y1?y2?y2???????

然后再对 ? ( x ) \phi (x) ?(x) ? ( y ) \phi (y) ?(y)进行内积运算:
< ? ( x ) , ? ( y ) > = ( x 1 y 1 ) 2 + 2 x 1 x 2 y 1 y 2 + ( x 2 y 2 ) 2 <\phi (x), \phi (y)>=(x_{1}y_{1})^{2}+2x_{1}x_{2}y_{1}y_{2}+(x_{2}y_{2})^{2} <?(x),?(y)>=(x1?y1?)2+2x1?x2?y1?y2?+(x2?y2?)2
我们发现结果和直接展开运算一样,但是直接展开经过了一次平方运算,复杂度为 O ( n 2 ) O(n^{2}) O(n2),而经过映射之后只需一次内积运算,复杂度为 O ( n ) O(n) O(n),大大提高了效率。

再比如,对于核函数:
KaTeX parse error: No such environment: align at position 8: \begin{?a?l?i?g?n?}? K(x,y)&=(x^{T}…
同上,若 x x x y y y均为二维向量,则映射函数为:
? = [ x 1 x 1 x 1 x 2 x 2 x 1 x 2 x 2 2 c x 1 2 c x 2 ] \phi =\begin{bmatrix} x_{1}x_{1}\\ x_{1}x_{2}\\ x_{2}x_{1}\\ x_{2}x_{2}\\ \sqrt{2c}x_{1}\\ \sqrt{2c}x_{2}\\ \end{bmatrix} ?=?????????x1?x1?x1?x2?x2?x1?x2?x2?2c ?x1?2c ?x2???????????
从多项式可以看到,参数 c c c控制着一阶和二阶多项式的权重。如果将二阶多项式推广到 d d d阶,则核函数 K ( x , y ) = ( x T y + c ) d K(x,y)=(x^{T}y+c)^{d} K(x,y)=(xTy+c)d会将原来的向量映射到 ( n + d d ) \begin{pmatrix} n+d\\ d\\\end{pmatrix} (n+dd?)维,尽管在该空间中的复杂度为 O ( n d ) O(n^{d}) O(nd),但经过$\phi 映 射 后 计 算 复 杂 度 为 映射后计算复杂度为 O(n)$。

4. 常见的核方法

常见的三种核方法:
线性核(Linear kernel): K ( x , y ) = x T y K(x,y)=x^{T}y K(x,y)=xTy
径向基核(Radial basis function kernel, RBF kernel): K ( x , y ) = e x p ( ? γ ∥ x ? y ∥ 2 ) K(x,y)=exp(-\gamma \left \| x-y\right \|^{2}) K(x,y)=exp(?γx?y2)
d d d次多项式核(Polynomial kernel): K ( x , y ) = ( x T y + c ) d K(x,y)=(x^{T}y+c)^{d} K(x,y)=(xTy+c)d
下面我们依次使用这些核函数对非线性问题进行分类,如下图所示,有两个待分类标签,显然他们在二维空间是线性不可分的,我们需要使用核函数把它们映射到更高维空间中,让它们线性可分。
图2

4.1 线性核

核函数:
K ( x , y ) = x T y K(x,y)=x^{T}y K(x,y)=xTy
x = ( x 1 , x 2 ) T x=(x_{1},x_{2})^{T} x=(x1?,x2?)T y = ( y 1 , y 2 ) T y=(y_{1},y_{2})^{T} y=(y1?,y2?)T,即维度为2,我们得到:
KaTeX parse error: No such environment: align at position 8: \begin{?a?l?i?g?n?}? K(\begin{pmatr…
可以看到线性核的映射 ? ( x ) \phi (x) ?(x)就是 x x x本身。

代码:

import numpy as np
import pandas as pd
import seaborn as sns
from matplotlib import pyplot as plt
from mpl_toolkits.mplot3d import Axes3D
from mpl_toolkits import mplot3d
from IPython.display import HTML, Image

%matplotlib inline
sns.set()

from sklearn.datasets import make_circles

def feature_map_1(X):
    return np.asarray((X[:,0], X[:,1], X[:,0]*X[:,1])).T

X, y = make_circles(100, factor=.1, noise=.1)
Z = feature_map_1(X)

#2D scatter plot
fig = plt.figure(figsize = (16,8))
ax = fig.add_subplot(1, 2, 1)
ax.scatter(X[:,0], X[:,1], c = y, cmap = 'viridis')
ax.set_xlabel('$x_1$')
ax.set_ylabel('$x_2$')
ax.set_title('Original dataset')

#3D scatter plot
ax = fig.add_subplot(1, 2, 2, projection='3d')
ax.scatter3D(Z[:,0],Z[:,1], Z[:,2],c = y, cmap = 'viridis' ) #,rstride = 5, cstride = 5, cmap = 'jet', alpha = .4, edgecolor = 'none' )
ax.set_xlabel('$z_1$')
ax.set_ylabel('$z_2$')
ax.set_zlabel('$z_3$')
ax.set_title('Transformed dataset')

我们将线性核函数映射后的数据可视化,得到的结果如图3所示,但从结果发现,线性映射之后的数据点仍然不是线性可分的。

图3

4.2 多项式核

二维二阶多项式核函数:

因此, ? ( ( x 1 x 2 ) ) = ( 2 x 1 x 2 x 1 2 x 2 2 ) \phi (\begin{pmatrix} x_{1}\\ x_{2} \\ \end{pmatrix})=\begin{pmatrix} \sqrt{2}x_{1}x_{2}\\ x_{1}^{2}\\ x_{2}^{2}\\ \end{pmatrix} ?((x1?x2??))=???2 ?x1?x2?x12?x22?????

画出经二阶多项式映射后的数据分布:

import numpy as np
import pandas as pd
import seaborn as sns
from matplotlib import pyplot as plt
from mpl_toolkits.mplot3d import Axes3D
from mpl_toolkits import mplot3d
from IPython.display import HTML, Image

#%matplotlib inline
sns.set()

from sklearn.datasets import make_circles

def feature_map_0(X):
    return np.asarray((X[:,0]**2, X[:,1]**2, np.sqrt(2)*X[:,0]*X[:,1])).T

X, y = make_circles(100, factor=.1, noise=.1)
Z = feature_map_0(X)

#2D scatter plot
fig = plt.figure(figsize = (16,8))
ax = fig.add_subplot(1, 2, 1)
ax.scatter(X[:,0], X[:,1], c = y, cmap = 'viridis')
ax.set_xlabel('$x_1$')
ax.set_ylabel('$x_2$')
ax.set_title('Original dataset')

#3D scatter plot
ax = fig.add_subplot(1, 2, 2, projection='3d')
ax.scatter3D(Z[:,0],Z[:,1], Z[:,2],c = y, cmap = 'viridis' ) #,rstride = 5, cstride = 5, cmap = 'jet', alpha = .4, edgecolor = 'none' )
ax.set_xlabel('$z_1$')
ax.set_ylabel('$z_2$')
ax.set_zlabel('$z_3$')
ax.set_title('Transformed dataset')

图4

本文原载于我的简书

参考


  1. 核方法 ??

  2. Kernels and Feature maps: Theory and intuition ??

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2022-04-28 11:50:53  更:2022-04-28 11:54:02 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2025年1日历 -2025/1/6 17:38:09-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码