采纳答案成功!
向帮助你的同学说点啥吧!感谢那些助人为乐的人
是不是根据训练数据集的train_score很大,然后调了几次参数还是很大来判断?
通常,我们只能看出我们的模型到底是欠拟合,还是过拟合。如果是在欠拟合的情况下,到底为什么欠拟合,这个背后的原因需要具体问题具体分析,不能一概而论,很难使用一个固定指标就看出来。学习机器学习算法,其实主要训练的就是这个具体情况具体分析的能力。
另外,在机器学习领域,很难讲模型选择的是正确还是错误。只有合适不合适。而且,合适不合适的界限也是模糊的。不过整体而言,在你的数据“没有问题”的情况下,欠拟合是相对好解决的。不管是什么模型,只要增加模型的复杂度,都一定会表现出“没有欠拟合,而开始过拟合“的“症状”。所以我在课程中说,解决“过拟合”才是机器学习的核心。至于如何解决过拟合,可以参考这里:https://coding.imooc.com/learn/questiondetail/39781.html
另外,一个需要考虑的非常重要的因素是:数据。很多时候,机器学习的结果不够好,可能你的模型选择也没有问题;你的超参数选择也没有问题;但是你的数据有问题。或者数据不够;或者数据不能涵盖所有情况;甚至数据和你要学习的内容根本不相关。在这些情况下,算法是无法补救的。
就是说如果数据足够多,特征足够相关,那么选择任何模型都是可以的?因为只要增加复杂度就可以了。
选择任何模型,都可以做到看起来“不再欠拟合”,这不代表选择任何模型都是可以的。请体会一下其中的逻辑:)
一个模型做到不再欠拟合,然后也用数学方法消除过拟合,这个模型是不是可以拿来用了吗?
老师,课程里提到knn的k,和多项式回归的degree,它们从小变大,偏差方差都是此消彼长,我以为模型的偏差方差都是这么变化的。 提到的那些高偏差高方差的模型是怎么回事? 是不是模型选的也不对,然后数据也不好?
此消彼长不代表完全消除。我经常会举这么一个例子。你要考语文数学两门课程。但你复习时间有限,复习了语文,语文成绩会提高,但数学成绩会下降;复习了数学,数学成绩会提升,但是语文成绩下降。但关键是,复习语文,语文成绩虽然会提高,但不意味着会提高到100分。可能你的基础非常差,两门课都是20分的水平,复习复习语文,语文课是30分了,数学课降到15分,但两门课依然不及格。这就是高偏差高方差。
大多数高偏差高方差,问题来自数据。或者数据质量不够好,不具有代表性;或者数据本身就和预测内容不相关。
大概明白了,老师,有没有办法模拟这种高方差高偏差的模型,好像目前学的的knn和多项式回归对随机生成的数据拟合的都很好,无法模拟出现高方差高偏差?
登录后可查看更多问答,登录/注册
Python3+sklearn,兼顾原理、算法底层实现和框架使用。
2.5k 19
3.5k 17
3.0k 15
1.6k 15
1.5k 14