采纳答案成功!
向帮助你的同学说点啥吧!感谢那些助人为乐的人
想问一下降维时为什么要让样本间间距最大,即方差最大,为什么这样就能够最大程度的保持原样本的特性?
首先,你要理解课程里的这个例子:对于这组样本:
以下两种方式都是不好的(即降维到横坐标或者纵坐标)
因为,他们没有最大程度反应原来数据之间的关系。
最好的是什么样子?大概是这个样子:
这个样子具体看是怎样的?其实就是在把所有的样本映射到一条直线以后,这些点之间的距离最大的保留了下来。设想一下,其他的直线,这些点映射以后,他们之间的距离只有可能更近。我们要尽量的区分不同的样本点。
“把所有的样本映射到一条直线以后,这些点之间的距离最大的保留了下来”,这句话用数学的语言表示,就是让这些样本映射到一根直线上,方差尽量的大。
继续加油!:)
非常感谢!
登录后可查看更多问答,登录/注册
Python3+sklearn,兼顾原理、算法底层实现和框架使用。
2.7k 19
3.7k 17
3.1k 15
1.7k 15
1.6k 14
购课补贴联系客服咨询优惠详情
慕课网APP您的移动学习伙伴
扫描二维码关注慕课网微信公众号