| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 人工智能 -> 讲座内容总结 -> 正文阅读 |
|
[人工智能]讲座内容总结 |
? ? ? ? 通过几天的聆听与学习,不仅增长了见识,拓宽了眼界,而且对本实验室有了一个大致的了解。本实验室的研究内容大都与机器学习有着密切关联,研究的内容多种多样,有理论与应用的研究,也有开创性的研究,成果比较丰富。各老师的研究方向主要包括主动学习、形式概念分析、推荐系统、肠道微生物组学数据分析、三支决策与粒计算等。 ? ? ? ? 下面则将对实验室研究的内容进行具体介绍。 1. 主动学习 ? ? ? ? ?主动学习与传统的有监督学习相比,是通过较少的训练样本,去训练一个精度较高的分类模型。提出这样的思想是因为在许多实际的情况下,标记样本的获取是比较困难的,这需要领域内的专家来进行人工标注,所花费的时间成本和经济成本都是很大的。而且,如果训练样本的规模过于庞大,训练的时间花费也会比较多。主动学习则采用一定的算法查询最有用的未标记样本,并交由专家进行标记,然后用查询到的样本训练分类模型来提高模型的精确度,有效的减少了时间与经济成本。 ? ? ? ?对于如何挑选关键样本,可以使用,密度聚类(density clustering)、多标准优化(Multi-Standard Optimization)。对于每块挑选的样本数,可以使用统计方法(statistical methods)。对于如何分裂成不同的块,可以使用标签误差统计方法(label error statistical methods)。 ?????? 未来研究方向:各种不同的查询策略、主动学习理论、实际场景下的应用、主动学习与多标签结合等等。 2. 肠道微生物组学数据机器学习方法研究 ????????微生物无处不在,包括人体微生物、植物微生物、动物微生物等等,它们以群体的方式发挥作用称为微生物组。自2007年人类微生物组项目的启动,到目前微生物的数据量已经非常庞大,关于其研究的论文也在呈指数级增长。 ????????将微生物数据与机器学习相结合是一个非常好的研究方向。但微生物数据的高维特征,少样本,强稀疏和样本不均衡特点给结合带来了麻烦。如何提升算法处理高维,少样本,强稀疏和样本不均衡数据的分类性是目前需要解决的重点。 ????????目前的一个思路是首先将这些数据进行分析预处理,然后再进行特征选择,将选择代表样本交由专家评估作为训练集,最后用训练集训练分类器模型,使其对疾病进行预测。 ?????? 未来研究重点:数据扩增,特征选择,集成学习。 3. 概念集的构建算法及其推荐应用 ???????形式背景是一个三元组,形式背景由一个三元组 T = ( O , D , R )表示,O表示所有对象的集合,D表示所有属性的集合,R表示 O和 D之间存在的一种二元关系。 ?????? 概念由一个二元组(E,I)表示,其中E表示外延,I表示内涵。概念中的外延是由形式背景中的对象构成,内涵是由外延中的对象共同拥有的属性构成。 ?????? 概念格,一个形式背景拥有唯一概念格,其包含了形式背景中的所有概念,是一个以概念为元素的偏序集,它可以通过Hasse图可视化,其中每个节点是一个概念。 ???????构造概念格具有很高的时间空间复杂度,但在推荐应用中只有部分的格或概念集得到利用。所以在推荐应用中,提出使用概念集合替代概念格。 ?????? 提出在概念选择时,采用最大面积方法,及外延中的对象个数乘以内涵中的属性个数最大。 ?????? 以电影举例,具体为某个用户推荐的流程是,找到包含这个用户的所有概念,在一个概念当中看其它对象是否观看过,从而计算出每个概念的推荐概率,再将这些概率组合在一起经过计算,就可以得出总的一个推荐概率,根据自己设置的标准,决定是否推荐。 ?????? 未来研究方向:不同的形式概念,不同的构造概念集的方法,不同的应用场景,不同的推荐策略等。 4. 推荐系统 ????????信息量的大幅增长导致信息超载(information overload)问题,解决信息超载问题一个非常有潜力的办法是推荐系统,它是根据用户的信息需求、兴趣等,将用户感兴趣的信息、产品等推荐给用户的个性化系统。 ?????? 推荐系统包括一些基础数据与附加信息。它可以利用用户的自身信息, 如: 性别、国籍、信仰、年龄、职业等等,也可以利用用户的社交网络,评论点赞等等信息进行推荐。 基于浏览矩阵的推荐: ?????? 对用户的浏览,购买进行预测,输入用户数据与评分矩阵,以最大化准确率的优化目标进行训练,得到预测矩阵。 基于评分矩阵的预测: ?????? 对评分的预测,输入为用户数据与评分矩阵,以最小化平均绝对误差(mean absolute error)与最小化均方误差 (root mean square error)为优化目标,得到预测矩阵。 交互推荐: ?????? 目前交互推荐是主流的推荐方式,推荐系统都会根据用户的选择优化推荐列表,也就是说用户这一轮的选择会影响下一轮的推荐列表。比如推荐系统一次给用户推荐20个商品,用户在本轮推荐中选择了商品1、3、5;这样的选择就会反馈给系统,系统根据用户的选择优化下一轮的推荐。 三支推荐: ?????? 在三支推荐中包含了推荐,不推荐和推广三种行为。利用代价矩阵算出两个阈值,通过随机森林的方式算出用户喜欢商品的概率,看这个概率在哪个范围内,从而进行不同操作。 推荐系统的魔法边界: ?????? 对于一个推荐系统的数据集,由于人们或者环境的各种原因,数据集都会有一定的错误,这也导致了没有任何一个算法能够达到100%精度,而这个精度上限就叫做魔法边界。一个数据集一旦给定,这个魔法边界就确定了。一旦知道了这个值,我们就可以确定算法到底还有多大的优化空间。 5. 三支决策与粒计算 ????????三支决策是一种思维方式,人们在做决策时,具有充分把握接受或拒绝的事物能够立刻决定和不决定,对于那些不能立即作出决策的事物,会推迟对事件的判断,即延迟决策。 ?????? 三支决策模型中存在两个阈值,将整个决策空间分为了三部分,对于不同部分会选择不同的处理方式。 ????????在基于预训练模型的砂土地震液化势评估研究中,由于原数据量过少,训练出的模型正确率过低,对此采用了一种思路,将模型进行预训练,预训练的数据为与原数据有联系的数据,比如,训练自行车模型,用摩托车数据进行预训练。预训练完成之后,再用原数据进行调整,得到的模型比直接用原数据进行训练的精度更高。 6. 机器学习、人工智能方法解决油气田勘探开发的实际问题 ????????在地质勘探时可以利用地震的方式对地层进行勘探,地震为人工地震,利用炸药产生强烈的地震波,通过设立收集器,将各种反射波、折射波等收集在一起,将这些数据进行降噪等处理,再进行解释,就可以获得地下地层的情况。 ?????? 地震数据会有各种各样的噪声,包括背景噪声,随机噪声,强脉冲干扰等,在进行降噪时可以直接利用图像的降噪方法进行处理,采用峰值信噪比对降噪结果进行评价。 |
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年12日历 | -2024/12/22 10:48:28- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |