感谢黄海光教授无私开源!!!
机器学习概述
个人定义
机器根据数据修炼模型,依靠模型预测未来的方法
要认识的大佬
国内的 李航-统计学习方法 周志华-西瓜书
应用领域
- 模式识别
- 数据挖掘
- 计算机视觉
- 语音识别
- 统计学习
- 自然语言处理
机器学习的类型
内容太多!【传送门】 大致有:
- 是否在人类监督下学习(监督学习、非监督学习、半监督学习和强化学习)
- 是否可以动态的增量学习(在线学习和批量学习)
- 是简单的将新的数据点和已知的数据点进行匹配,还是像科学家那样对训练数据进行模型检测,然后建立一个预测模型(基于实例的学习和基于模型的学习)
机器学习的背景知识
永远不会读的希腊字母
永远学不会的数学基础
- 概率论与数理统计-随机事件和概率、概率的基本性质和公式、常见分布、期望、协方差
环境差不多就是三件套! Anacond+Jupyter notebook + Pycharm 以前的博客里面有写 推荐一下黄老师的【传送门】
Python的主要数据类型
Python的主要数据类型
- 列表list[]
- 元组tuple()
- 集合set()
- 字典dict{}
python控制流
- 顺序结构
- 分支结构
- 循环结构
- break、continue和pass
- 列表生成式
python函数
- 调用函数
- 定义函数 def 函数名():
- 匿名函数lambda
python模块
- pandas
- numpy
- scipy
- matplotlib
- scikit-learn
机器学习的开发流程
一般步骤
我觉得这点体现得很好 我们在遇到新的问题时,常常会抽取我们大脑的知识储备,根据以往经验做出决策和判单 机器亦如此,面对新的输入数据,通过历史数据训练好模型,预测未来 常见步骤:
- 数据收集
- 数据清洗
- 特征工程
- 数据建模
黄老师的总结太精妙!!! 不经意间笑出giegie声
黄老师说: 成功的机器学习应用不是有用最好的算法,而是拥有最多的数据!
|