请稍等 ...
×

采纳答案成功!

向帮助你的同学说点啥吧!感谢那些助人为乐的人

关于监督学习的分类

老师您好

用标签为3类的样本训练出的模型,当在生产环境中出现完全和这3类不符合的样本,会出现什么样的情况,应该怎么解决这种情况

正在回答

1回答

你的训练样本只有三类,上了真实数据实际有第四类,你的模型当然辨识不出来。你的模型会错误地把这个类别分类成为三类中的一个。


你的训练数据只有猫和狗,测试数据来了一张图片是一个人。你的模型还是会把这张图片分类成为猫或者狗。


解决方案只有一个:用含有完整类别的训练数据重新训练模型。


继续加油!:)

1 回复 有任何疑惑可以回复我~
  • 提问者 oracola #1
    非常感谢!
    回复 有任何疑惑可以回复我~ 2020-10-22 06:52:44
  • 老师您好,
    我也有个这样的疑惑,假如我的生产环境中会出现三类,即猫、狗和人,但人占比98%,猫、狗各占1%,样本非常不均衡,猫狗数据真的很少。
    问题来了,我能不能只拿猫和狗的样本做二分类模型,单纯的预测新样本像猫和狗的概率是多少,总的概率不等于1,这样像人的概率=(1-像猫概率-像狗概率),然后就比较哪个类大就归谁。有没有这样的解决方案呢?
    或者假如预测数据是一个人的照片时,既不像猫也不像狗,可能这个二分类概率是50%-50%,或者40%-60,都不算绝对的把握归为哪一类,我就把这种情况归为人,这样有一定逻辑吗?
    回复 有任何疑惑可以回复我~ 2021-06-07 11:31:35
  • 我其实没有特别理解你的的问题,关于问题1,什么叫 “生产环境中会出现三类”?训练过程到底有几类?对于问题2,我没有见过这样的逻辑,至少直接去想没有想到,因为用猫和狗的数据去判断是人本身是不合逻辑的。如果既不像猫,又不像狗,为什么就是人?为什么不是大象或者青蛙?对于我接触的应用,更负责的判断是:在给出分类的同时,给出概率。比如机器认为这张照片是 狗,但只有 51% 的概率,这已经说明了这个判断的置信度了。对于置信度,你可以在实际应用中选择不相信。比如垃圾邮件过滤系统中,只对 70% 肯定是垃圾邮件的内容做过滤,低于 70%,即使机器认为是垃圾邮件,也不过滤。
    回复 有任何疑惑可以回复我~ 2021-06-07 13:06:43
问题已解决,确定采纳
还有疑问,暂不采纳
意见反馈 帮助中心 APP下载
官方微信