关于数据X-train 和y_train之间，他们之间有什么联系？-慕课网

1回答

liuyubobobo 2018-07-10 13:18:12

首先，X_train更准确的说是二维数组。行数代表有多少数据，列数代表数据的特征数量。y_train是一个向量。y_train中的元素个数和X_train的行数一样，y_train中第i个元素表示X_train中第i行的数据所对应的output。

以上的这些逻辑，就是 X_train 和 y_train的所有关联。计算机不知道X_train 和 y_train 有这样的联系。是我们算法设计者知道。所以我们在设计算法的时候会使用这些联系。我们的算法完全可以在纸上推导出来。如果你愿意，完全可以使用纸笔计算。计算机只是帮助我们快速计算而已。

再仔细理解一下这一小节我们设计的算法，以及最后完成的代码。之所以我们的代码要这样实现，正是因为X_train和y_train满足这样的关系：）

这里举一个例子。有些同学不理解为什么以下的代码可以将 y == 0 和 y == 1 的两类数据点以不同颜色分别绘制出来：

plt.scatter(X_train[y_train==0,0], X_train[y_train==0,1], color='g')
plt.scatter(X_train[y_train==1,0], X_train[y_train==1,1], color='r')
plt.show()

事实上，我们正是因为知道X_train和y_train之间的联系，特意设计程序，才让它能够绘制出来。具体可以参考这个问答：https://coding.imooc.com/learn/questiondetail/36343.html

请再体会一下：不是计算机知道X_train和y_train之间有联系。而是我们算法设计者将数据特意布置成这个样子，运用这种数据布置上关系，完成的算法：）

2 回复有任何疑惑可以回复我~

收起回答

提问者大门旁的桂花树 #1
```
非常感谢！
```
回复有任何疑惑可以回复我~ 2018-08-15 14:42:59

亦余心之所善兮灬 #2

老师   这一行 plt.scatter(X_train[y_train==0,0], X_train[y_train==0,1], color='g')  这个的意思是 嘛？X_train[y_train==0,0],第一个0表示y_train等于0，第二个0表示取第0个数，也就是y_train（i）这个点的x轴的值

回复有任何疑惑可以回复我~ 2019-07-11 21:18:24

liuyubobobo 回复亦余心之所善兮灬 #3

看看这个问答能不能解决你的疑问？https://coding.imooc.com/learn/questiondetail/36343.html 加油！：）

回复有任何疑惑可以回复我~ 2019-07-12 00:57:47

关于数据X-train 和y_train之间，他们之间有什么联系？

正在回答

1回答

相似问题

请选择置顶位置

本课精华内容

PCA降维的把握和依据分别是什么？比如把一个近似直线分布的二维点数据降维成直线？

关于线性回归中归一化处理和不对归一化处理的问题

数据归一化为什么有用？对归一化无法直观理解

如何判断欠拟合是因为模型选择错误还是超参数选择错误？

学好具体算法和机器学习的实际应用之间有哪些距离？

关于 XGBoost

关于机器学习不同的指标

其他算法的决策边界

在三维数据上的 PCA

关于回归和分类

热搜

最近搜索清空