机器学习sklearn的学习与运用——数据预处理 — 标准化（来自Educoder）

代码实现：

from sklearn.datasets import fetch_california_housing
from sklearn import preprocessing

dataset = fetch_california_housing("./step4/")
X_full, y = dataset.data, dataset.target
#抽取其中两个特征数据
X = X_full[:, [0, 5]]
def getMinMaxScalerValue():
    '''
    对特征数据X进行MinMaxScaler标准化转换，并返回转换后的数据前5条
    返回值:
    X_first5 - 数据列表
    '''
    X_first5 = []
    #   请在此添加实现代码   #
    # ********** Begin *********#
    min_max_scaler = preprocessing.MinMaxScaler()
    X_first5 = min_max_scaler.fit_transform(X)
    # ********** End **********#
    return X_first5[:5]  #取前五条数据
def getScaleValue():
    '''
        对目标数据y进行简单scale标准化转换，并返回转换后的数据前5条
        返回值:
        y_first5 - 数据列表
        '''
    y_first5 = []
    #   请在此添加实现代码   #
    # ********** Begin *********#
    y_first5 = preprocessing.scale(y)
    # ********** End **********#
    return y_first5[:5]  #取前五条数据
def getStandardScalerValue():
    '''
    对特征数据X进行StandardScaler标准化转换，并返回转换后的数据均值和缩放比例
    返回值:
    X_mean - 均值
    X_scale - 缩放比例值
    '''
 
    #   请在此添加实现代码   #
    #********** Begin *********#
    scaler = preprocessing.StandardScaler().fit(X)
    #********** End **********#
    return scaler.mean_,scaler.scale_