论文阅读:Multi-Label Learning with Global and Local Label Correlation(GLOCAL)实验部分
数据集:Arts, Business, Computers, Education, En-tertainment, Health, Recreation, Reference, Science, Social Society,Corel5k3 and Image4 评价指标: 排名损失(Rkl):负面标签排名高于正面标签的分数。 ROC 曲线下的平均面积 (Auc):正实例排名高于一个负例,对所有标签进行平均所得。 覆盖率(Cvg):计算需要多少步才能将预测的标签排名向下移动以覆盖实例的所有正标签。 平均精度 (Ap):这是排名高于特定正标签的正标签的平均分数。
实验:
1.在完整标签数据集(既不考虑缺失标签的情况下):在大多数数据集上,GLOCAL是所有测量方法中最好的两种方法之一。GLOCAL的成功是由于同时优化了标签矩阵的低秩分解、到潜在标签的特征空间映射,以及编码全局和局部标签相关性的拉普拉斯矩阵。通过标签矩阵的低秩分解,我们得到了更紧凑、信息更丰富的潜在标签。与稀疏的、二值的、高维的原始标签空间相比,从特征空间到稠密的、实值的、低维的潜在标签空间的映射更容易学习。在少数族裔标签的存在下尤其如此,几乎没有正面的例子。此外,全球标签流形提供了标签如何作为一个整体相互关联的信息,并有助于学习少数民族标签。如果少数标签与其他标签正相关(或负相关),我们可以鼓励其标签分类器输出与其他标签的输出更相似(或不同)。本地标签流形还允许标签分类器的本地自适应。拉普拉斯矩阵的学习可以发现最适合全局和局部数据子集的标签相关性,并避免了手动指定标签相关性这一通常很难完成的任务。
2.在缺失标签数据集:GLOCAL在不同的ρ下对缺失标签恢复和测试标签预测的表现最好。其优越性的原因是其潜在标签的联合学习、实例标签映射,以及利用全局和局部标签相关性。此外,先恢复缺失的训练标签,然后分类的两阶段方法在预测测试集标签方面并不有效。这是因为MAXIDE会在标签恢复过程中导致错误,然后会传播到分类过程。
实验结论:
GLOCAL算法通过学习潜在标签表示并优化标签流形,同时恢复丢失的标签,训练分类器并利用全局和局部标签相关性。与以前的工作相比,它是第一个利用全局和局部标签相关性的方法,它可以直接学习Laplacian矩阵,而无需任何其他有关标签相关性的先验知识。此外,GLOCAL为全标签和缺失标签多标签学习提供了统一的解决方案。实验结果表明,在具有完整标签和缺失标签的学习方面,该方法优于最新的多标签学习方法。
论文阅读:Multi-label active learning through serial-parallel neural networks (MASP)
简介:本文提出了一种基于串-并神经网络 (MASP) 的多标签主动学习算法。对于标签关联,网络的串行部分提取所有标签共有的特征。这种机制比显式特征提取和压缩感知方法更有效。对于缺少的标签,网络将其损耗设置为用于反向传播的零。这样,就不需要完成可能会引入其他错误的标签。对于标签查询,网络的并行部分独立地为每个标签提供成对的预测。这种成对预测提供了计算标签不确定性的适当信息。在20个基准数据集上进行了3组实验,并与14个流行算法进行了比较。实验结果表明,该算法达到了最先进的主动学习性能。
确定研究课题:MLBF(Multi-label learning through boolean matrix factorization)
技术:1.布尔矩阵的分解 2.串并联网络的分类
串并联网络
串联神经网络:两个神经网络串联训练,第一个网络输出一个二维矩阵,中间处理变成三维矩阵,然后输入第二个网络。训练时只有第二个网络有loss,想通过这一个loss优化第一个网络和第二个网络的参数。直接调用优化器训练会使整个网络坏掉。
并联网络:并联”两个子网络,将他们的输出层Concat到一起,然后在二者合并之后的网络上继续添加隐层。
布尔矩阵的分解
布尔矩阵:01矩阵(矩阵内的元素非true即false)
布尔矩阵分解:将布尔矩阵输入,分解成多个结果矩阵的乘积,结果矩阵都是布尔型
常见的算法:ASSO,PANDA,MEBF等。例如其中ASSO采样的是贪心的算法,就是迭代k次,从C的所有列向量中选择k个出来,每一次迭代,都找能够使当前误差下降最大的那个列向量。
|