采纳答案成功!
向帮助你的同学说点啥吧!感谢那些助人为乐的人
上节课问题里提到,metrics的default ‘minkowski’,然后p是和它配合使用的,metric指的是the distance metric to use for the tree. 这里的tree是什么意思?
weights的几种距离也是度量,和metrics里的度量什么区别?
我理解是weights是用于predict阶段的,而metrics是用于计算k个点阶段的,不知道是不是这个意思?
对于kNN的组织有一种优化方式,将数据组织成一个树结构,可以更快的获得k个最近的相邻样本。tree是指这个树结构。
metric衡量的是两个样本之间的距离;weights表示在找到k个最近的样本以后,是简单的用少数服从多数?(uniform)还是同时要考虑这k个最近样本里不同类离我们的待预测样本的距离(distance),及上一小节8:30处所讲的两种在找到k个最近邻后决定分类的方式。
非常感谢!
上一小节8:30处所讲的两种在找到k个最近邻后决定分类的方式,看起来是一种方式都是考虑距离因素,解决了两种情况:K点内邻近点多但距离少数点倒数距离加权值更大 + 平票问题。
还有想到一点就是,觉得老师数据结构算法课可以和具体的库结合起来讲,比如sklearn里面怎么把树用到KNN优化里面去的,因为自己写确实没用到树。
登录后可查看更多问答,登录/注册
Python3+sklearn,兼顾原理、算法底层实现和框架使用。
2.5k 19
3.5k 17
3.0k 15
1.6k 15
1.5k 14