IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> 论文阅读 (38):Learning Multi-Instance Enriched Image Representations via Non-Greedy Ratio Maximizat (泛读) -> 正文阅读

[人工智能]论文阅读 (38):Learning Multi-Instance Enriched Image Representations via Non-Greedy Ratio Maximizat (泛读)

引入

??题目通过 ? 1 \ell_1 ?1?范数距离的非贪婪比最大化学习多实例图像表示 (Learning Multi-Instance Enriched Image Representations via Non-Greedy Ratio Maximization of the ? 1 \ell_1 ?1?-Norm Distances)
??代码
??摘要:近年来多示例 (MIL) 在图像应用领域效果显著。然而,两个关键挑战阻碍了MIL在图像中的有效应用:
??1)现有方法通常基于图像中的实例建模,而非完整图像。这可能丢失图像作为整体输入时所传达的信息;
??2)输入图像中的实例数量可变,导致传统单向量方法不适用。
??对此,本文提出一种新的图像表示学习方法,将输入图像 (包) 的局部块 (实例) 及其整体表示集成为一个单向量
??1)首先学习投影以保持输入图像实例的全局和局部一致性;
??2)然后将同一图像的整体表示投影到所学习的子空间中,以丰富信息;
??3)考虑到自然场景和照片中内容和特征的变化,开发了优化目标,即使得许多 ? 1 \ell_1 ?1?范数之和的比例最大化;
??4)给出了一种新的有效的非贪婪迭代算法,并严格证明了算法的收敛性。一个示意如下图:

1 习得MIL图像的单向量表示

1.1 符号系统和问题声明

??符号表如下:

符号含义
矩阵粗体大写字母
向量粗体小写字母
t r ( M ) = ∑ i m i i \mathbf{tr(M)}=\sum_im_{ii} tr(M)=i?mii?矩阵 M = [ m i j ] \mathbf{M}=[m_{ij}] M=[mij?]的迹
∥ M ∥ 1 = ∑ i ∑ j ∣ m i j ∣ \|\mathbf{M}\|_1=\sum_i\sum_j\mid m_{ij}\mid M1?=i?j?mij?矩阵 M \mathbf{M} M ? 1 \ell_1 ?1?范数
v = ∑ i ∣ v i ∣ \mathbf{v}=\sum_i\mid v_i \mid v=i?vi?向量 v \mathbf{v} v ? 1 \ell_1 ?1?范数
∥ v ∥ 2 = ∑ i v i 2 \|\mathbf{v}\|_2=\sqrt{\sum_iv_i^2} v2?=i?vi2? ?向量 v \mathbf{v} v ? 2 \ell_2 ?2?范数
X = { x , X } \mathcal{X}=\{ \mathbf{x}, \mathbf{X}\} X={x,X}图像
x ∈ R d \mathbf{x}\in\mathbb{R}^d xRd图像的整体表示
X = [ x 1 , … , x n ] ∈ R d × n \mathbf{X}=[\mathbf{x}_1,\dots,\mathbf{x}_n]\in\mathbb{R}^{d\times n} X=[x1?,,xn?]Rd×n语义块的集合

??基于以上符号系统,每一个图像看作是包含实例 (语义块) 的包,且每个包中的实例数量通常不同。
??不同于以往的MIL,基于输入图像的实例建模,本文的目标为习得一个输入图像到单向量表示 y = f ( X ) \mathbf{y}=f(\mathcal{X}) y=f(X)的函数,其用于捕捉图像的局部块及整体信息。由于图像的每一个单向量是等长的,则可以使用任意的单实例模型进行学习。简单来说,这是一个基于映射的MIL方法。

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2022-01-28 11:54:55  更:2022-01-28 11:55:52 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2025年1日历 -2025/1/10 16:17:47-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码