因为我们需要首先考虑的是当前的业务场景和客观条件,不能够生搬硬套某一个算法的具体实现。例如我们前面介绍过的推荐系统,虽然都是协同过滤,但是在具体的业务场景下需要考虑的问题非常多。另一个方面就是,我们在使用算法之前一定要考虑到算法的某些特定使用场景,就拿预处理来说,有些算法要求一定要预处理(PCA),有些则不是,我们在进行预处理的时候都要考虑进去,不能盲目地更换算法而忽视客观限制。
还有一点就是,机器学习是非常吃数据的,这也是我为什么一直强调机器学习与大数据天生就是共生的,我们不能盲目相信算法一定会取得好的结果,因为数据集的数据样本多少,样本分的概率分布情况,训练当时是否正确等都会影响算法的最终输出结果,这一点在深度学习上更明显了。