| |
|
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
| -> 人工智能 -> Siamese Network 孪生网络基础学习笔记 -> 正文阅读 |
|
|
[人工智能]Siamese Network 孪生网络基础学习笔记 |
Siamese Network 孪生网络基础学习笔记本笔记主要是对相关文章的摘录梳理,作为小白学习目标跟踪的学习笔记。 孪生网络在目标跟踪中有很重要的应用,故特作此整理,希望为后续的学习打好基础。 整理的比较仓促,后续会修改完善。 参考文章链接:
一. Siamese Network 名字的由来Siamese在英语中是“孪生”、“连体”的意思。具体由来参见Siamese network 孪生神经网络:一个简单神奇的结构 二. 孪生网络的主要特点
三. Siamese Network的模型架构
孪生网络的核心特征是两个子网络的权重是共享的。因为这种共享,两个输入相当于采用了相同的编码机制映射到相同的向量空间。进而我们就能通过对embedding后得到的的向量进行处理,计算两者的相似度。
四. 孪生神经网络的用途是什么?孪生网络主要用来衡量两个输入的相似程度。该模型能够处理但不局限于“匹配”问题。 五. 孪生神经网络和伪孪生神经网络Pseudo Siamese Network 伪孪生网络如果两个子体网络不共享权重,即两个子体是不同的神经网络,则称为Pseudo Siamese Network,伪孪生神经网络。伪连体孪生经网络的两个子体,可以是结构相同但权重不同,也可以是完全不同的结构,如一个是CNN,另一个是RNN。CNN和RNN的这种连体网络,可以用来比对不同数据类型的信息所表达的内容的相似性,如一个图片和一段文字。
孪生神经网络和伪孪生神经网络分别适用的场景孪生神经网络用于处理两个输入"比较类似"的情况。伪孪生神经网络适用于处理两个输入"有一定差别"的情况。比如,我们要计算两个句子或者词汇的语义相似度,使用siamese network比较适合;如果验证标题与正文的描述是否一致(标题和正文长度差别很大),或者文字是否描述了一幅图片(一个是图片,一个是文字),就应该使用pseudo-siamese network。也就是说,要根据具体的应用,判断应该使用哪一种结构,哪一种Loss。 六. Siamese network 的 loss function
常用损失1. contrastive loss 对比损失函数
2. cosine距离与exp距离
3. Triplet loss在 Triplet loss 中,我们使用数据的三元组而不是二元对。 三元组由anchor、正样本和负样本组成,主要用于面部识别。 在 Triplet loss 中,anchor和正样本编码之间的距离被最小化,而anchor和负样本编码之间的距离被最大化。 Triplet loss 将 d(a,p) 推到 0 ,并且 d(a,n) 大于 d(a,p)+margin 七. 为什么Siamese神经网络被称为one-shot分类?
八. Siamese 网络的优点
九. Siamese 网络的缺点仅输出相似性分数而不输出概率。(互斥事件的概率总和为 1。而距离不限于小于或等于 1。) 十. Siamese network是双胞胎连体,整一个三胞胎连体行不行?不好意思,已经有人整过了,叫Triplet network,论文是《Deep metric learning using Triplet network》,输入是三个,一个正例+两个负例,或者一个负例+两个正例,训练的目标是让相同类别间的距离尽可能的小,让不同类别间的距离尽可能的大。Triplet在cifar, mnist的数据集上,效果都是很不错的,超过了siamese network。四胞胎,五胞胎会不会更屌?。。。。。目前还没见过。。。。 十一. Siamese network的应用
|
|
|
|
|
| 上一篇文章 下一篇文章 查看所有文章 |
|
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
| 360图书馆 购物 三丰科技 阅读网 日历 万年历 2025年10日历 | -2025/10/23 5:05:54- |
|
| 网站联系: qq:121756557 email:121756557@qq.com IT数码 |