题目
广义多实例学习的判别概率框架(Discriminative Probabilistic Framework for Generalized Multi-Instance Learning)
Bib
@inproceedings{Anh:2018:22812285,
author={Anh T Pham and Raviv Raich and Xiaoli Z Fern and Weng-Keen Wong and Xinze Guan},
title={Discriminative Probabilistic Framework for Generalized Multi-Instance Learning},
booktitle={2018 {IEEE} International Conference on Acoustics, Speech and Signal Processing (ICASSP)},
pages={2281--2285},
year={2018},
organization={IEEE}
}
摘要
多实例学习是一个框架,用于从由包级别标记的实例包组成的数据中学习。多实例学习中的一个常见假设是,当且仅当包中至少一个实例为正时,包标签为正。在实践中,这个假设可能会被违反。例如,专家可能会为包含许多实例的包提供嘈杂的标签,以减少标记时间。 在这里,我们考虑广义的多实例学习,它假设包标签是基于包中正实例的数量非确定性确定的。这种设置的挑战是同时学习实例分类器和未知的包标签概率规则。本文使用具有精确和有效推理的判别概率图模型解决了广义多实例学习。对合成数据和真实数据的实验说明了所提出的方法相对于其他方法的有效性,包括那些遵循传统多实例学习假设的方法。
方法概述
背景
在实际中,标记包标签的过程通常是嘈杂且不精确的,违反了基于存在的假设。
相关概念
广义多实例学习: 如果专家认为包中存在足够数量的阳性实例,他们可能只会将袋子标记为阳性。例如,一个图像被标记为“森林”当且仅当它包含超过十个“树”段。
步骤
本文提出了一种用于广义多实例学习的判别概率图模型。将包标签与包中正例的数量相关联。 目标:得到实例级分类器、包标签分类器 一、实例级分类器:将实例特征向量与相应的实例标签相关联(逻辑回归函数建模) 实例的标签通过通过包中该实例对应的特征向量得到;
w
w
w是逻辑回归参数
二、包标签器:包标签通过正实例的数量与实例标签相关联;
N
b
N_b
Nb?是包中正实例数量;
v
v
v是包标签器参数向量 三种预测包标签概率的方式: 方式一:
v
=
[
v
0
,
v
1
,
…
,
v
m
]
\textbf{v}=[v_0,v_1,\dots,v_m]
v=[v0?,v1?,…,vm?]该模型以独立的方式为正实例数的每个可能值分配袋标签概率 方式二:
v
=
[
v
0
,
v
1
]
\textbf{v}=[v_0,v_1]
v=[v0?,v1?],当
v
1
\textbf{v}_1
v1?>0时,正面标记袋子的概率随着正面实例标签的数量而增加。 方式三:
v
=
[
v
0
]
\textbf{v}=[v_0]
v=[v0?],如果袋子中的正面实例的数量大于或等于v0,则该模型提供对袋子的正面标签的确定性分配 目标:学习实例分类器参数w向量和bag标记参数向量v
实验
HJA bird song、MSCV2 image annotation 将几个类视为正类,其余类视作负类来形成两类数据集
|