采纳答案成功!
向帮助你的同学说点啥吧!感谢那些助人为乐的人
老师您好
用标签为3类的样本训练出的模型,当在生产环境中出现完全和这3类不符合的样本,会出现什么样的情况,应该怎么解决这种情况
你的训练样本只有三类,上了真实数据实际有第四类,你的模型当然辨识不出来。你的模型会错误地把这个类别分类成为三类中的一个。
你的训练数据只有猫和狗,测试数据来了一张图片是一个人。你的模型还是会把这张图片分类成为猫或者狗。
解决方案只有一个:用含有完整类别的训练数据重新训练模型。
继续加油!:)
非常感谢!
老师您好, 我也有个这样的疑惑,假如我的生产环境中会出现三类,即猫、狗和人,但人占比98%,猫、狗各占1%,样本非常不均衡,猫狗数据真的很少。 问题来了,我能不能只拿猫和狗的样本做二分类模型,单纯的预测新样本像猫和狗的概率是多少,总的概率不等于1,这样像人的概率=(1-像猫概率-像狗概率),然后就比较哪个类大就归谁。有没有这样的解决方案呢? 或者假如预测数据是一个人的照片时,既不像猫也不像狗,可能这个二分类概率是50%-50%,或者40%-60,都不算绝对的把握归为哪一类,我就把这种情况归为人,这样有一定逻辑吗?
我其实没有特别理解你的的问题,关于问题1,什么叫 “生产环境中会出现三类”?训练过程到底有几类?对于问题2,我没有见过这样的逻辑,至少直接去想没有想到,因为用猫和狗的数据去判断是人本身是不合逻辑的。如果既不像猫,又不像狗,为什么就是人?为什么不是大象或者青蛙?对于我接触的应用,更负责的判断是:在给出分类的同时,给出概率。比如机器认为这张照片是 狗,但只有 51% 的概率,这已经说明了这个判断的置信度了。对于置信度,你可以在实际应用中选择不相信。比如垃圾邮件过滤系统中,只对 70% 肯定是垃圾邮件的内容做过滤,低于 70%,即使机器认为是垃圾邮件,也不过滤。
登录后可查看更多问答,登录/注册
Python3+sklearn,兼顾原理、算法底层实现和框架使用。
2.5k 19
3.5k 17
3.0k 15
1.6k 15
1.5k 14