机器学习的定义
Machine Learning is Fields of study that gives computers the ability to learn without being explicitly programmed 译:机器学习是通过非显著式编程使得计算机获得学习能力的领域
显著式编程
- 例如对于区分菊花与玫瑰,如果认为告诉计算机,菊花为黄色,玫瑰为红色,则计算机看到黄色则识别为菊花,看到红色则识别为玫瑰,此为显著式编程。
- 若仅仅给计算机输入一堆菊花与一堆玫瑰的图片,然后编写程序,让计算机自己区别菊花与玫瑰的区别,计算机也能通过大量的图片,总结出菊花是黄色的,玫瑰是红色的规律,也能总结出菊花花瓣较长,玫瑰花瓣较圆等等可以区分两种花的规律。即让计算机自己总结规律的编程方法,叫做非显著式编程
A computer program is said to learn from experience E with respect to some tast T and some performance measure P if its performance on T as measured by P improved with experience E. 译:一个计算机程序被称为可以学习,是指它能够针对某个任务T和某个性能指标P,从经验E中学习。这种学习的特点是,它在T上的被P所衡量的性能,会随着经验E的增加而提高。
机器学习任务的分类
监督学习:所有经验E都是人工采集并输入计算机的机器学习任务,称为监督学习。
强化学习:经验E是由计算机与环境互动获得的,计算机产生行为,同时获得这个行为的结果,程序只需要定义行为的收益函数,设计算法,让计算机改变自己的行为模式去最大化收益函数。此类让计算机通过与环境的互动逐渐强化自己的行为模式,称为强化学习。
监督学习分类
-
根据数据标签存在与否的分类
- 传统的监督学习
每一个训练数据都有对应的标签,代表算法有:支持向量机、人工神经网络、深度神经网络。 - 非监督学习
如果所有的训练数据都没有对应的标签,则称为非监督学习。 需要假设:同一类的新联数据在空间中距离更近,则可根据样本空间的信息,设计算法将其聚集为两类,从而实现无监督学习。 代表算法:聚类、EM算法、主成分分析 - 半监督学习
训练数据中一部分有标签,一部分没有标签,研究利用少量的标注数据和大量的未标注数据来设计算法进行学习。 -
基于标签的固有属性分类
-
分类 监督学习中,标签是离散的值,则为分类任务。 -
回归 监督学习中,标签是连续的值,则为回归任务。
|