可解释的机器学习
中文标题:面向生物多样性的ML方法:一个新的野生蜜蜂数据集和用于ML辅助稀有物种注释的XAI方法的评估 英文标题:Towards ML Methods for Biodiversity: A Novel Wild Bee Dataset and Evaluations of XAI Methods for ML-Assisted Rare Species Annotations 时间:2022.6.15 作者:Teodor Chiaburu, Felix Biessmann, Frank Hausser 机构:柏林工程应用技术大学(Berlin University of Applied Sciences) 链接:https://arxiv.org/pdf/2206.07497.pdf 简介:昆虫是我们生态系统的重要组成部分。可悲的是,在过去几十年里,他们的数量令人担忧地减少了。为了更好地了解这一过程并监测昆虫种群,深入学习可能会提供可行的解决方案。然而,鉴于昆虫分类学的广度和细粒度分析的典型障碍,例如组内变异性高而组间变异性低,昆虫分类仍然是一项具有挑战性的任务。基准数据集很少,这阻碍了更好AI模型的快速开发。然而,稀有物种训练数据的注释需要专家知识。可解释人工智能(XAI)可以帮助生物学家完成这些注释任务,但选择最佳的XAI方法很困难。我们对这些研究挑战的贡献有三个方面:1)从iNaturalist数据库中采集的野生蜜蜂的完整注释图像数据集,2)在野生蜜蜂数据集上训练的ResNet模型,其分类得分与在其他细粒度数据集上训练的类似最先进模型相当;3)研究XAI方法,以支持生物学家进行注释任务。
异步脉冲神经网络
中文标题:具有连接拉普拉斯算子的层神经网络 英文标题:Sheaf Neural Networks with Connection Laplacians 时间:2022.6.17 作者:Federico Barbero, Cristian Bodnar, Haitz Sáez de Ocáriz Borde, Michael Bronstein, Petar Veli?kovi?, Pietro Liò 机构:剑桥大学(University of Cambridge)、牛津大学(University of Oxford )、DeepMind 链接:https://arxiv.org/pdf/2206.08702.pdf 简介:Sheaf神经网络(SNN)是一种对Sheaf进行操作的图形神经网络(GNN),Sheaf是一个对象,在其节点和边上为图形配备向量空间以及这些空间之间的线性映射。SNN已被证明具有有用的理论特性,有助于解决由异性恋和过度平滑引起的问题。这些模型固有的一个复杂性是为要解决的任务找到一个好的层。之前的工作提出了两种截然相反的方法:基于领域知识手动构建层和使用基于梯度的方法端到端地学习层。然而,领域知识通常不足,而学习一捆可能会导致过度拟合和显著的计算开销。在这项工作中,我们从黎曼几何中得到启发,提出了一种计算滑轮的新方法:我们利用流形假设来计算流形和图形感知正交映射,从而优化对齐相邻数据点的切线空间。我们表明,与以前的SNN模型相比,这种方法以较少的计算开销获得了有希望的结果。总的来说,这项工作在代数拓扑学和微分几何之间提供了一种有趣的联系,我们希望它将激发这一方向的未来研究。
类脑计算
中文标题:稀疏高维线性回归模型选择的鲁棒信息准则 英文标题:Robust Information Criterion for Model Selection in Sparse High-Dimensional Linear Regression Models 时间:2022.6.17 作者:Prakash B. Gohain, Magnus Jansson 机构:IEEE 链接:https://arxiv.org/pdf/2206.08731.pdf 简介:在处理高维数据时,线性回归模型中的模型选择是一个主要挑战,其中可用测量值的数量(样本大小)远小于参数空间的维度。传统的模型选择方法,如Akaike信息准则、贝叶斯信息准则(BIC)和最小描述长度,在高维环境下极易过度拟合。在这方面,扩展BIC(EBIC)是原始BIC的扩展版本,扩展Fisher信息准则(EFIC)是EBIC和Fisher信息准则的组合,是真实模型的一致估计量,因为测量数量增长非常大。然而,在高信噪比(SNR)情况下,EBIC并不一致,在这种情况下,样本大小是固定的,EFIC对导致不稳定行为的数据缩放不是不变的。在本文中,我们提出了一种新形式的EBIC准则,称为EBIC鲁棒性准则,该准则对数据缩放不变性,并且在大样本量和高信噪比情况下保持一致。为了保证其一致性,给出了分析证明。仿真结果表明,EBIC鲁棒性能明显优于EBIC和EFIC。
脑机接口
中文标题:稀疏时空脑-机接口的因子分解方法 英文标题:Factorization Approach for Sparse Spatio-Temporal Brain-Computer Interface 时间:2022.6.17 作者:Byeong-Hoo Lee, Jeong-Hyun Cho, Byoung-Hee Kwon, Seong-Whan Lee 机构:高丽大学(Korea University) 链接:https://arxiv.org/pdf/2206.08494.pdf 简介:最近,先进技术在解决大量数据的各种问题方面有着无限的潜力。然而,这些技术在处理大脑信号的脑-机接口(BCI)方面尚未显示出有竞争力的性能。基本上,大脑信号很难大量收集,特别是在自发BCI中,信息量很稀少。此外,我们推测任务之间的高度空间和时间相似性会增加预测难度。我们将这个问题定义为稀疏条件。为了解决这个问题,引入了因子分解方法,使模型能够从潜在空间中获得不同的表示。为此,我们提出了两种特征提取器:通过对抗式学习训练类公共模块作为生成器;分类模块利用分类产生的损失函数,采用传统方法提取特征。为了最小化类公共特征和类特定特征共享的潜在空间,在正交约束下对模型进行训练。因此,EEG信号被分解为两个独立的潜在空间。对单臂运动图像数据集进行评估。结果表明,通过对脑电信号进行因子分解,模型可以在稀疏条件下提取丰富而决定性的特征。
|