请稍等 ...
×

采纳答案成功!

向帮助你的同学说点啥吧!感谢那些助人为乐的人

关于 OvR 的疑问

老师好,关于 OvR ,我有些疑问。
您看看,下面我的理解,是否有误。

老师好,如果一个样本有5个,分别对应 A、B、B 、C、D 四个类别。
那么来一个新样本 :

那这个属于A类别概率是 (1+1) / (1+ 5)   = 1/3
那这个属于B类别概率是 (2+1) / (1+ 5)   = 1/2
那这个属于C类别概率是 (1+1) / (1+ 5)   = 1/3
那这个属于D类别概率是 (1+1) / (1+ 5)   = 1/3

由于属于B类别概率最高,所以这个新样本,属于 B类别 概率最大?
总觉得哪不对
图片描述

正在回答

1回答

一个样本属于哪个类别的概率,和样本总量没有关系。是你将某个类别的样本当做X类,其他类别的所有样本当做Y类,然后训练一个分类器,这个分类器预测出的这个样本属于X的概率和属于Y的概率谁高。


比如,有100个样本,25个属于A,25个属于B,25个属于C,25个属于D。

使用OVR解决这个四分类问题,你需要训练4个模型。


第一个模型,将25个属于A的样本分为一类;其他75个不属于A的样本分为一类。进行训练。

这个模型,可以判断出一个样本属于A的概率是多少(或者说不属于A的概率是多少)。


第二个模型,将25个属于B的样本分为一类;其他75个不属于B的样本分为一类。进行训练。

这个模型,可以判断出一个样本属于B的概率是多少(或者说不属于B的概率是多少)。


第三个模型,将25个属于C的样本分为一类;其他75个不属于C的样本分为一类。进行训练。

这个模型,可以判断出一个样本属于C的概率是多少(或者说不属于C的概率是多少)。


第四个模型,将25个属于D的样本分为一类;其他75个不属于D的样本分为一类。进行训练。

这个模型,可以判断出一个样本属于D的概率是多少(或者说不属于D的概率是多少)。


现在,来了一个新样本。这个新样本就可以分别进入四个模型,得到这个样本属于A,B,C,D的概率。取高者。


加油:)

1 回复 有任何疑惑可以回复我~
  • 提问者 lemonlxn #1
    嗯,有点慢慢理解了。比如说这个新样本属于 A类别的概率为 25% ,属于 B\C\D 类别的概率比 25% 要低,则该样本属于 A 类别
    回复 有任何疑惑可以回复我~ 2019-03-13 10:30:55
  • liuyubobobo 回复 提问者 lemonlxn #2
    对滴:)
    回复 有任何疑惑可以回复我~ 2019-03-13 11:47:35
  • 老师好,关于这个,我有个问题,以 0,1 分类为例,当我们传入一个新的样本时,根据样本特征,得到一个在 0 到 1 之间的概率,当大于等于 0.5我们认为这个样本是 1,反之是 0,这里哪里体现了这个样本是 1 或是 0 的概率呢?根据我的理解,假如计算出来是 0.6,难道是1 的概率是 0.6,是 0 的概率是0.4?这似乎还是说的通,但假如计算结果是0.4,又该怎么看它是谁的多少的概率呢?
    回复 有任何疑惑可以回复我~ 2019-07-03 16:01:38

相似问题

登录后可查看更多问答,登录/注册

问题已解决,确定采纳
还有疑问,暂不采纳
意见反馈 帮助中心 APP下载
官方微信