老师好,我之前问过这个问题,但我还是有些疑惑,需要再向您请教下。
假如我这里有10000个样本,10个特征。
我想在随机森林中生成500个决策树,max_features = 4,bootstrap=True。
请问:
1.请问每颗数的样本数是一样的吗?各自每颗样本数又是多少?
2.我这里设置最大特征为4。
第一颗树,可以从这10个特征,任意挑4个特征?
如 第1、4、7、8个特征?
第二颗树,可以从这10个特征,任意挑4个特征?
如 第2、6、9、10个特征?
然后以此类推?
3.每颗决策树在每个节点的最优划分,是基于这4个特征?
4.如果随机森林进行分类任务的话,是基于少数服从多数的要求吗?那有 soft voting 的设置吗?
登录后可查看更多问答,登录/注册