| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 人工智能 -> 【(强推)李宏毅2021/2022春机器学习课程】2022-语音与影像上的神奇自监督学习模型【精】 -> 正文阅读 |
|
[人工智能]【(强推)李宏毅2021/2022春机器学习课程】2022-语音与影像上的神奇自监督学习模型【精】 |
文章目录pdf | 视频 Review:Self-supervised Learning for TextSelf-supervised Learning for Speech少量有标注的数据用来训练:Downstream Model(例如简单的Linear模型),如果有需要,也可以微调整个模型(不是必要的) 语音版的BERT Self-supervised Learning for Imageself-supervised 超过 supervised,非常有潜力的 1. Generative Approaches语音上
照搬不行,语音和文字还是有性质上的差异,还是要针对语音的特性做一些设计。 所以,语音上,要mask一长串的feature,不要一次只mask一个feature,迫使机器去解比较难的问题 在语音上,你可以做一个不一样的尝试:mask 向量的某几个dimension,这样方法会让机器学到 语者(?语义?)的资讯 GPT系列用在语音上, image上2. Predictive Approach(分析Generator的缺点:语音和影响包含很多细节,直接生成很困难)这种制造简单的任务让机器去解,借此来学到一些东西的方法有各式各样,千变万化,论文数不胜数 问题:到底是什么样的小任务可以激发机器的潜能? 还没有特别好的答案。需要你需要对声音,影像 特性有更多的了解,才能设计出比较好的小游戏给机器来玩。 接下来比较通用的做法:简化生成,让它变成比较简单的东西,再预测 3. Contrastive Learning(不产生任何东西就做self-supervise learning)
那问题就变成了怎么做 Data Augmentation? 太简单,机器学不到东西,太难, 也是不行的。怎么控制Augmentation的程度?看原始论文SimCLR,尝试了各式各样Augmentation的组合,告诉你说怎么做Augmentation最好的。文献上说,random cropping是最有效的 语音上的 SimCLR:Speech SimCLR 另一类:MoCo(多了memory bank 和 momentum encoder),增加了训练的小技巧,让训练可以成功,具体自己看文献 语音上的Contrastive Learning 输出的token 是 Discrete(离散的),为什么:1.利用BERT;2.去除了其它杂讯 2.0: 一起训练(Continuous vs dicrete ?)
对于计算资源不够的话,显然Contrastive更好。 根本原因:Infinite negative examples?(存不下搞不了,所以先做个聚类) 又存在问题:Negative Examples 怎么选?比如猫跟天空,可能只学到 抽 “颜色"的资讯 4. Bootstrapping Approaches (接下来讲两招:避开negative example的选择)这是什么妖术? 右边要有predictor 和 copy,才能 不Collapse 关键点:左右 架构不同 另外观点 理解:Bootstrapping 5. Simply Extra Regularizaion
Concluding Remarks(还有非常非常多的方法…) |
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 | -2024/11/26 10:31:44- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |