bobo老师好。
您之前提过,决策树,在每个节点的划分,寻找到最优的 特征 与 阈值。
问题一:
在集成学习中,由于传入决策树,所以 放回取样的bagging 、random_subspaces、 random_patches 等随机森林,是否并没有寻找最优的 特征与 阈值,而只是在随机特征中,寻找最优的阈值。
问题二:
我们通过 bagging,传入一个决策树,就可以创建一个随机森林。
随机森林,是在随机的特征子集上,取寻找最优阈值。那这个是否与random_subspaces是一致。
问题三:
随机森林,是在随机的特征子集上,取寻找最优阈值。是否存在,在某个节点通过 A特征划分,然后在之后的节点,接着通过对A特征进行划分的情况呢?
问题四:
在放回取样中,是否存在一个接口,返回 oob 具体哪些没有被取到的样本数据呢?
我在 RandomForestClassifier 做了测试,不过只找到 oob 对应的概率值。