数据转换 :标准化vs 归一化(附代码&链接)
标准化和归一化的区别
何时使用标准化和归一化
如何用Python实现特征缩放
“特征缩放的目的是使得所有特征都在相似的范围内,因此建模时每个特征都会变得同等重要,并且更便于机器学习的算法进行处理。”
from sklearn.preprocessing import MinMaxScaler
scaler = MinMaxScaler()
scaler.fit(df)
scaled_features = scaler.transform(df)
#Convert to table format - MinMaxScaler
df_MinMax = pd.DataFrame(data=scaled_features, columns=["Age", "Salary","Purchased","Country_France","Country_Germany", "Country_spain"])
特征缩放后
工资变量的常态分布和标准差
特征缩放的使用场景:
注:如果算法不是基于距离计算,特征缩放则不重要,比如朴素贝叶斯和线性判别分析,以及树模型(梯度提升、随机森林等)。
使用特征缩放的目的
标准化与归一化的区别
需要使用标准化或归一化的算法
在Python中实现特征缩放
获取代码和数据集合,请使用一下连接:
https://github.com/clareyan/feasturescaling
END
转自: 数据派THU 公众号;
版权声明:本号内容部分来自互联网,转载请注明原文链接和作者,如有侵权或出处有误请和我们联系。
合作请加QQ:365242293
数据分析(ID : ecshujufenxi )互联网科技与数据圈自己的微信,也是WeMedia自媒体联盟成员之一,WeMedia联盟覆盖5000万人群。
关注公众号:拾黑(shiheibook)了解更多
[广告]赞助链接:
四季很好,只要有你,文娱排行榜:https://www.yaopaiming.com/
让资讯触达的更精准有趣:https://www.0xu.cn/

随时掌握互联网精彩
赞助链接
排名
热点
搜索指数
- 1 推动中哥战略伙伴关系走深走实 7904088
- 2 美国调整对华加征关税 7808375
- 3 国台办回应特朗普突然提到“统一” 7712409
- 4 外国人眼中的中国经济韧性 7618562
- 5 南方未来10天捅了“雨窝” 7522459
- 6 多名在英国中国公民失踪失联 7424054
- 7 刘国梁被恶意造谣 中国乒协发声 7332388
- 8 女子称穿瑜伽服上门做饭不是为流量 7237235
- 9 林志炫:不是直播我不会回《歌手》 7137234
- 10 姜同学你在人生大考中已获满分 7046374