特征工程
特征工程的基础知识见这篇
模型评估
估计器(estimator)中的评估方法
在sklearn中,估计器(estimator)是一个重要的角色,是一类实现了算法的API
其实就可以理解为平时用的各种分类、回归的算法(吧)
- 调用fit
- estimator.fit(X_train, y_train)
- 输入测试集的数据
- y_ = estimator.predict(X_test)
- 或者预测的准确率:estimator.score(X_test, y_test)
分类算法
分类算法中的评估
关于混淆矩阵、准确率、精确率、召回率,以及如何调优
模型的选择与调优
交叉验证与网格搜索
K-近邻算法
KNN算法详见这篇文章
朴素贝叶斯算法
见这篇
决策树与随机森林
决策树与随机森林的基础篇
决策树实操
随机森林实操
极限森林、梯度提升树
极限森林与梯度提升树的介绍
包括梯度提升树的二分类原理介绍
有很多算法其实既有分类器也有回归器,比如梯度提升树,既有GradientBoostingClassifier,也有GradientBoostingRegressor
其实回归是分类的极限情况,分类的类别多到一定程度就是回归了
Adaboost
Adaboost介绍
逻辑斯蒂回归
逻辑斯蒂回归,用于分类问题
回归算法
线性回归
线性回归的介绍
根据线性回归原理手写实现了线性回归算法
其他回归模型的介绍,岭回归、Lasso回归、逻辑斯蒂回归等的官网介绍
|