请稍等 ...
×

采纳答案成功!

向帮助你的同学说点啥吧!感谢那些助人为乐的人

如何判断欠拟合是因为模型选择错误还是超参数选择错误?

是不是根据训练数据集的train_score很大,然后调了几次参数还是很大来判断?

正在回答

2回答

liuyubobobo 2018-03-07 01:53:29

通常,我们只能看出我们的模型到底是欠拟合,还是过拟合。如果是在欠拟合的情况下,到底为什么欠拟合,这个背后的原因需要具体问题具体分析,不能一概而论,很难使用一个固定指标就看出来。学习机器学习算法,其实主要训练的就是这个具体情况具体分析的能力。


另外,在机器学习领域,很难讲模型选择的是正确还是错误。只有合适不合适。而且,合适不合适的界限也是模糊的。不过整体而言,在你的数据“没有问题”的情况下,欠拟合是相对好解决的。不管是什么模型,只要增加模型的复杂度,都一定会表现出“没有欠拟合,而开始过拟合“的“症状”。所以我在课程中说,解决“过拟合”才是机器学习的核心。至于如何解决过拟合,可以参考这里:https://coding.imooc.com/learn/questiondetail/39781.html


另外,一个需要考虑的非常重要的因素是:数据。很多时候,机器学习的结果不够好,可能你的模型选择也没有问题;你的超参数选择也没有问题;但是你的数据有问题。或者数据不够;或者数据不能涵盖所有情况;甚至数据和你要学习的内容根本不相关。在这些情况下,算法是无法补救的。

2 回复 有任何疑惑可以回复我~
  • 提问者 神经旷野舞者 #1
    就是说如果数据足够多,特征足够相关,那么选择任何模型都是可以的?因为只要增加复杂度就可以了。
    回复 有任何疑惑可以回复我~ 2018-03-07 19:39:01
  • liuyubobobo 回复 提问者 神经旷野舞者 #2
    选择任何模型,都可以做到看起来“不再欠拟合”,这不代表选择任何模型都是可以的。请体会一下其中的逻辑:)
    回复 有任何疑惑可以回复我~ 2018-03-07 19:47:29
  • 提问者 神经旷野舞者 回复 liuyubobobo #3
    一个模型做到不再欠拟合,然后也用数学方法消除过拟合,这个模型是不是可以拿来用了吗?
    回复 有任何疑惑可以回复我~ 2018-03-07 19:53:36
提问者 神经旷野舞者 2018-03-07 19:49:41

老师,课程里提到knn的k,和多项式回归的degree,它们从小变大,偏差方差都是此消彼长,我以为模型的偏差方差都是这么变化的。
提到的那些高偏差高方差的模型是怎么回事?
是不是模型选的也不对,然后数据也不好?

0 回复 有任何疑惑可以回复我~
  • 此消彼长不代表完全消除。我经常会举这么一个例子。你要考语文数学两门课程。但你复习时间有限,复习了语文,语文成绩会提高,但数学成绩会下降;复习了数学,数学成绩会提升,但是语文成绩下降。但关键是,复习语文,语文成绩虽然会提高,但不意味着会提高到100分。可能你的基础非常差,两门课都是20分的水平,复习复习语文,语文课是30分了,数学课降到15分,但两门课依然不及格。这就是高偏差高方差。
    回复 有任何疑惑可以回复我~ 2018-03-07 19:53:20
  • 大多数高偏差高方差,问题来自数据。或者数据质量不够好,不具有代表性;或者数据本身就和预测内容不相关。
    回复 有任何疑惑可以回复我~ 2018-03-07 19:54:44
  • 提问者 神经旷野舞者 回复 liuyubobobo #3
    大概明白了,老师,有没有办法模拟这种高方差高偏差的模型,好像目前学的的knn和多项式回归对随机生成的数据拟合的都很好,无法模拟出现高方差高偏差?
    回复 有任何疑惑可以回复我~ 2018-03-07 19:57:50
问题已解决,确定采纳
还有疑问,暂不采纳
意见反馈 帮助中心 APP下载
官方微信