本文共 1099 字,大约阅读时间需要 3 分钟。
我们把特征工程的接口称之为转换器,其中转换器调用有这么几种形式
In [1]: from sklearn.preprocessing import StandardScalerIn [2]: std1 = StandardScaler()In [3]: a = [[1,2,3], [4,5,6]]In [4]: std1.fit_transform(a)Out[4]:array([[-1., -1., -1.], [ 1., 1., 1.]])In [5]: std2 = StandardScaler()In [6]: std2.fit(a)Out[6]: StandardScaler(copy=True, with_mean=True, with_std=True)In [7]: std2.transform(a)Out[7]:array([[-1., -1., -1.], [ 1., 1., 1.]])
从中可以看出,fit_transform的作用相当于transform加上fit。但是为什么还要提供单独的fit呢, 我们还是使用原来的std2来进行标准化看看
In [8]: b = [[7,8,9], [10, 11, 12]]In [9]: std2.transform(b)Out[9]:array([[3., 3., 3.], [5., 5., 5.]])In [10]: std2.fit_transform(b)Out[10]:array([[-1., -1., -1.], [ 1., 1., 1.]])
转载地址:http://lsili.baihongyu.com/