IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> 多示例论文阅读--Multi-Instance Ensemble Learning With Discriminative Bags -> 正文阅读

[人工智能]多示例论文阅读--Multi-Instance Ensemble Learning With Discriminative Bags

BIB

@article{yang:2021:multi,
author		=	{Yang, Mei and Zhang, Yu-Xuan and Wang, Xizhao and Min, Fan},
title		=	{Multi-Instance Ensemble Learning With Discriminative Bags},
journal		=	{{IEEE} Transactions on Systems, Man, and Cybernetics: Systems},
year		=	{2021},
publisher	=	{IEEE}
}

总体框架

  • TBBM(traditional bagbased mapping)
    传统的基于包的映射算法
    仅考虑空间分布来生成kBagSet(关键包集)
  • ELDB(ensemble learning with discriminative bags)
    基于判别包的映射算法
    进一步考虑数据的标签信息来生成一个dBagSet(鉴别包集)
    并引入一种自增强机制来学习和更新现有的dBagSet
    使用集成技术生成一系列加权模型

关键技术

  • 判别包选择技术
  • 分类器集成技术

1、包选择技术

包选择技术由两部分组成,用于生成dBagSet:判别分析:通过考虑basic数据集的空间和标签分布,生成判别矩阵和dBagSet。自增强机制用于确定dBagSet是否可以更新。

1.1 判别分析

组合优化目标:使得新特征空间中属于 T d \mathcal{T}_d Td?的所有包的可分辨性总和最大
max ? T e ? T d ? T J ( T d , T e ) = 1 2 ∑ B ξ i , B ξ j ∈ T d d i j δ i j \max _{\mathcal{T}_{e} \subseteq \mathcal{T}_{d} \subset \mathcal{T}} \mathcal{J}\left(\mathcal{T}_{d}, \mathcal{T}_{e}\right)=\frac{1}{2} \sum_{\boldsymbol{B}_{\xi_{i}}, \boldsymbol{B}_{\xi_{j}} \in \mathcal{T}_{d}} d_{i j} \delta_{i j} Te??Td??Tmax?J(Td?,Te?)=21?Bξi??,Bξj??Td??dij?δij?

其中

  • bag-link矩阵: Δ = [ δ i j ] N d × N d \Delta=\left[\delta_{i j}\right]_{N_{d} \times N_{d}} Δ=[δij?]Nd?×Nd??
  • δ i j = { 1 , y ξ i ≠ y ξ j ? 1 , y ξ i = y ξ j \delta_{i j}=\left\{\begin{array}{cc} 1, & y_{\xi_{i}} \neq y_{\xi_{j}} \\ -1, & y_{\xi_{i}}=y_{\xi_{j}} \end{array}\right. δij?={1,?1,?yξi???=yξj??yξi??=yξj???, λ i j > 0 \lambda_{ij}>0 λij?>0是一个比例参数
    也就是说,为了让 T d \mathcal{T}_d Td?中包的可分辨性最大,就要让 T d \mathcal{T}_d Td?中任意两个不同标签的包之间的距离最大,任意两个相同标签的包之间的距离最小

但是我们现在的问题是,如何找出 T e \mathcal{T}_e Te?,逐个遍历时间复杂度太高

改进方法为,将优化目标改为:
max ? T ? T d ? T ∑ B ξ k ∈ T e p ξ k \max\limits_{\mathcal{T}\subseteq{\mathcal{T}_{d} \subset \mathcal{T}}} \sum\limits_{\boldsymbol{B}_{\xi_{k}} \in \mathcal{T}_{e}} p_{\xi_{k}} T?Td??Tmax?Bξk??Te??pξk??

只需要计算 T d \mathcal{T}_d Td?中每个包的分数,然后找出分数最大的前 ψ \psi ψ个包组成 T e \mathcal{T}_e Te?即可

1.2自增强机制

符号表示
T e i \mathcal{T}_e^i Tei?作为dBagSet的第 i i i次更新,其中 T e 0 \mathcal{T}_e^0 Te0? T d \mathcal{T}_d Td?通过判别分析获得
a i a_i ai?表示 T e i \mathcal{T}_e^i Tei?是否将要被更新

自增强机制有两种模式:
a:采用贪婪策略,以尽可能多地寻找具有高分辨率的行李。
r:采用竞争策略,以排除一些包

自增强步骤
1:将更新状态设置为0
2:找出包 B ζ k ∈ T e i B_{\zeta k} \in \mathcal{T}_{e}^{i} Bζk?Tei?中打分 p ζ k p_{\zeta_{k}} pζk??最低的包的索引 τ = arg ? min ? B ζ k ∈ T e i p ζ k \tau=\arg \min _{\boldsymbol{B}_{\zeta k} \in \mathcal{T}_{e}^{i}} p_{\zeta_{k}} τ=argminBζk?Tei??pζk??
3:对于 T ′ \mathcal{T}^{'} T中的每一个包,如果打分比 p ζ τ p_{\zeta_{\tau}} pζτ??大就进行更新,更新结束后就将 a i a_i ai?置为1
当模式为a时:直接放进去,
当模式为r时:用分高的的替换分低的

2、集成技术

因为只采用 T e β \mathcal{T}_e^\beta Teβ?会丢失 T e 0 \mathcal{T}_e^0 Te0?的信息,而且基于集成模型可以降低仅仅基于单一模型的不确定性,因此采用集成技术。
M = f c model? ( V , Y ) w = f c weight? ( V , Y , M ) y ^ i = f c predict? ( b i , M ) \begin{aligned} M &=f_{c}^{\text {model }}(\boldsymbol{V}, \boldsymbol{Y}) \\ w &=f_{c}^{\text {weight }}(\boldsymbol{V}, \boldsymbol{Y}, M) \\ \hat{y}_{i} &=f_{c}^{\text {predict }}\left(\boldsymbol{b}_{i}, M\right) \end{aligned} Mwy^?i??=fcmodel??(V,Y)=fcweight??(V,Y,M)=fcpredict??(bi?,M)?

M M M是训练好了的单实例分类器
w w w是性能度量值
y ^ i \hat{y}_{i} y^?i? B i \bm{B}_i Bi?的预测标签

最后通过加权集成模型, B i \bm{B}_i Bi?的预测标签为:
y ^ i = sign ? ( ∑ j w j Y i j ) \hat{y}_{i}=\operatorname{sign}\left(\sum_{j} w_{j} Y_{i j}\right) y^?i?=sign(j?wj?Yij?)
其中
Y i j = f c predict? ( f b ( B i , T e i ) , M i ) Y_{i j}=f_{c}^{\text {predict }}\left(f_{b}\left(\boldsymbol{B}_{i}, \mathcal{T}_{e}^{i}\right), M_{i}\right) Yij?=fcpredict??(fb?(Bi?,Tei?),Mi?)

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2022-04-22 18:36:57  更:2022-04-22 18:40:38 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2025年1日历 -2025/1/6 17:28:36-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码