监督学习与非监督学习
监督学习
简单解释: 监督学习就是要在一组有标签信息的数据中训练一个模型,然后将该模型应用于一组测试数据上分析模型的泛化误差。 监督学习会把数据分成训练集和测试集,监督学习方法的重要假设是数据的分布是独立同分布的。监督学习要在训练数据中归纳出一个一般规则然后应用于测试数据中。训练数据是有标签的,测试数据是没有标签的。 百度百科解释
非监督学习
简单解释: 非监督学习是在数据中无标记信息或者数据集中存在大量数据没有标签的情况下,使用某种规则或策略对数据进行分析归纳出数据的分布。比如,聚类。非监督的重点在于没有标记信息作为指导。非监督方法的数据假设参与训练的数据是独立同分布的。 百度百科解释
inductive learning 与 transductive learning
inductive learning
inductive learning与监督学习方法类似,基于已有的标记训练数据集构建和训练机器学习模型。 然后,我们使用这个训练过的模型来预测从未遇到过的测试数据集的标签。但是数据并不一定满足独立同分布,数据之间可能存在依赖关系。
transductive learning
直推式学习技术已经预先观察了所有数据,包括训练和测试数据集。 我们从已经观察到的训练数据集中学习,然后预测测试数据集的标签。 即使我们不知道测试数据集的标签,我们也可以在学习过程中利用这些数据中存在的模式和其他信息。直推式学习不能建立预测模型。 如果将新的数据点添加到测试数据集中,那么我们将必须从头开始重新运行算法,训练模型,然后使用它来预测标签。 另一方面,归纳学习建立了预测模型。 当您遇到新的数据点时,无需从头开始重新运行算法。每次有新数据点到达时,都必须重新运行所有内容。 同样的要求,transductive learning不要求数据是独立同分布的。
上述两种方法常用于图数据。
参考
https://www.zhihu.com/question/68275921 https://www.cnblogs.com/chuanyang/p/13892321.html
|