老师，国家分类可以用0，1，2，3...这样的数字表示吗？-慕课网

1回答

liuyubobobo 回答被采纳获得+3积分 2019-08-27 01:46:32

可以。但是不够好。

因为使用0，1，2 ... 这样的数据，默认了一种“序”的关系。更适合于比如：

危险等级，信用等级：低，中，高；

距离地铁的距离：步行可达；自行车可达；需要使用其他交通工具可达；

等等这样的分类变量。

但是，国家这样的的属性，是没有这样的“序”的，所以更好的方式是使用 one-hot 编码。在网上搜索一下 one-hot 编码自学一下，很简单的。

可以参考这个问答：http://coding.imooc.com/learn/questiondetail/134266.html

继续加油！：）

0 回复有任何疑惑可以回复我~

收起回答

提问者 ZzzZHH #1
```
非常感谢！
```
回复有任何疑惑可以回复我~ 2019-08-27 08:44:40

提问者 ZzzZHH #2

可是又出现新问题了，我将其中的4用One Hot表示成[0. 0. 0. 0. 1. 0.]，怎么塞回原数据中？
X=np.array([[100000,0.09,4],[200000,0.08,3]]转换成
X=np.array([[100000,0.09,0,0,0,0,1,0],[200000,0.08,0,0,0,1,0,0]这样吗？
辛苦老师

回复有任何疑惑可以回复我~ 2019-08-27 10:55:30

liuyubobobo 回复提问者 ZzzZHH #3

什么叫塞回原数据？不塞回。变换成的新的数据使你真正要使用的，用于后续预测的特征数据。这就像我们做多项式回归，做完了以后的数据是我们真正要使用的数据。

回复有任何疑惑可以回复我~ 2019-08-27 10:57:00

点开查看后面1条评论

老师，国家分类可以用0，1，2，3...这样的数字表示吗？

正在回答

1回答

相似问题

请选择置顶位置

本课精华内容

PCA降维的把握和依据分别是什么？比如把一个近似直线分布的二维点数据降维成直线？

关于线性回归中归一化处理和不对归一化处理的问题

数据归一化为什么有用？对归一化无法直观理解

如何判断欠拟合是因为模型选择错误还是超参数选择错误？

学好具体算法和机器学习的实际应用之间有哪些距离？

关于 XGBoost

关于机器学习不同的指标

其他算法的决策边界

在三维数据上的 PCA

关于回归和分类

热搜

最近搜索清空