采纳答案成功!
向帮助你的同学说点啥吧!感谢那些助人为乐的人
老师,请问这个fit的过程不涉及对数据预测,主要用于降维为什么不用X的全集进行,这样得到的结果不是更好吗?
如果仅仅是对现有数据降维,可以直接用整个 X 进行,没有问题。
但关键是,在机器学习算法中,降维是机器学习算法的前序步骤,所以,和其他机器学习算法一样,存在一个问题:我们需要测试算法的结果。为了测试算法的结果,我们必须模拟没有遇到的数据。测试数据集的意义就在这里。所以,我们在训练的时候,不能动测试数据集。因为测试数据集,是在模拟,我们在实际应用的时候,看不到,未知的数据集。这些数据信息,是不能包含在训练过程中的。
继续加油!:)
非常感谢!
登录后可查看更多问答,登录/注册
Python3+sklearn,兼顾原理、算法底层实现和框架使用。
3.3k 19
4.3k 17
3.7k 15
2.1k 15
2.0k 14
购课补贴联系客服咨询优惠详情
慕课网APP您的移动学习伙伴
扫描二维码关注慕课网微信公众号