开发: C++知识库 Java知识库 JavaScript Python PHP知识库人工智能区块链大数据移动开发嵌入式开发工具数据结构与算法开发测试游戏开发网络协议系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑笔记本显卡显示器固态硬盘硬盘耳机手机 iphone vivo oppo 小米华为单反装机图拉丁

-> 人工智能 -> 基于无监督多阶段特征 7defd -> 正文阅读

[人工智能]基于无监督多阶段特征 7defd

基于无监督多阶段特征学习的行人检测

基本介绍

该模型采用了一些新的方法，如多阶段特征、跳过层的连接来集成全局形状信息和局部特征motif信息，以及基于卷积稀疏编码的无监督方法来对每个阶段的滤波器进行预训练。

关键方法：

多阶段特征
跳过层
基于卷积稀疏编码的无监督方法

基本介绍

多阶段识别器学习层次结构的特征，调整到手头的任务，可以训练端到端，几乎没有先验知识。

以往设计的学习器可以手动设定相应的模型训练低级层次

无监督学习特征相关技术：

堆叠受限玻尔兹曼机
堆叠自编码器
堆叠稀疏自编码器

并在每一层使用非线性变化 softmax 函数

该系统使用无监督卷积稀疏自动编码器对来自相对较小的INRIA数据集的所有级别的特征进行预训练，并使用端到端监督训练来训练分类器，并以集成的方式对特征进行调优。

学习功能层次结构

行人检测的很多工作都集中在设计具有代表性和强大功能的功能上,一般的特征学习算法可以产生成功的特征提取器，可以达到最先进的结果。

无监督学习算法已被证明可以为一般对象识别问题产生良好的特征。无监督学习方法可以自动学习被识别对象的特征，代替以往的HOG和DPM算法的功能。

层次模型

层次特征提取系统由多个层次的特征提取器组成，这些特征提取器在连续的层次中执行相同的滤波和非线性变换功能。将输入映射为逐渐更高层次(或抽象)的表示。可以使用bert代替。

**卷积稀疏编码算法。**无监督模型的每一层都包含一个卷积稀疏编码算法和一个可用于快速推理的预测函数。在最后一层之后，使用分类器将特征表示映射到类标签。稀疏编码字典和预测函数都不包含任何硬编码参数，并从输入数据进行训练。不包含任何先验知识。

每一层都分别使用前一层的表示以无监督的方式进行训练。在以分层的方式训练整个多级系统之后，使用标记数据对完整的体系结构和分类器进行微调。

无监督训练

将参数映射到一个过完备的字典D,D属于 $R_{mn}m>n$ 这样做的目的是提取有效的特征表示。

在这里插入图片描述

这个公式目的取到一个输入到字典D的中最近的一个对象，其中 $\lambda是参数可以进行训练，s(z)表示惩罚函数$

输入到字典的映射不是全映射，只能取到离字典对象最近的那个映射。

$s (z)$ 表示惩罚函数，惩罚函数的具体选择根据所用的稀疏编码算法来决定，本文采用一范数 $_1$ 来作为惩罚函数

在这个问题当中待求表示矩阵 $z^*$ 以及字典 $D$ ，这是一个双求解的问题，表达公式如下

在这里插入图片描述

以往的算法是将输入图片分割成为多个patch,假设每个path相互独立，将patch作为输入求解对应的问题，就避免不了冗余的问题，该论文采用卷积预测稀疏分解,避免字典D的冗余，这个算法可以尝试使用Bert算法获得比较好的映射表示

预测函数是单层的ConvNet，预测函数形式如下:

$f(x;g,k,b)=\hat{z}=\hat{\{z_j\}}_{j=1,2,3...,n}\\ \hat{z}_j=g_j*tanh(x*k_j+b_j)$

f(x)是预测函数，预测函数的输出是一组特征映射，每一个特征都是

在这里插入图片描述

$D^*$ 表示一个完备字典集，着将最佳矩阵求解算法，变成二参数最佳求解算法。

二参数最佳求解算法没有办法直接求解，但保持一个不变另一个就可以变成可求解的问题。

特征学习和对象识别引入了卷积稀疏建模公式，我们使用中提出的卷积预测稀疏分解(convolutional Predictive sparse Decomposition, CPSD)模型，因为它是唯一一个提供快速预测函数的卷积稀疏编码模型，适合构建多阶段特征表示。

在这里插入图片描述

该模型使用的卷积核函数ConvNet

人工智能最新文章

2022吴恩达机器学习课程——第二课（神经网

第十五章规则学习

FixMatch: Simplifying Semi-Supervised Le

数据挖掘Java——Kmeans算法的实现

大脑皮层的分割方法

【翻译】GPT-3是如何工作的

论文笔记:TEACHTEXT: CrossModal Generaliz

python从零学（六）

详解Python 3.x 导入(import)

【答读者问27】backtrader不支持最新版本的

加:2022-03-22 20:35:19 更:2022-03-22 20:38:20

360图书馆购物三丰科技阅读网日历万年历 2025年7日历

-2025/7/13 5:51:33-

图片自动播放器
↓图片自动播放器↓

TxT小说阅读器
↓语音阅读,小说下载,古典文学↓

一键清除垃圾
↓轻轻一点,清除系统垃圾↓

图片批量下载器
↓批量下载图片,美女图库↓

网站联系: qq:121756557 email:121756557@qq.com IT数码