第九章 als recall 召回
val Array(training, test) = data.randomSplit(Array(0.8, 0.2))
training 只包含了80%的数据, 而且可能漏掉部分用户的行为数据;
例如某个用户 user_a, 他在原始的数据集中 有且只有一条浏览的pv记录, 那这个随机的 training dataset 可能没有包含这条记录, 我们用这个 training dataset 来训模型
val model = als.fit(training)// 找到一个最优的
最后我们用这个model 来进行召回, 召回的结果写入hbase
val list = model.recommendForAllUsers(20)
召回的结果list 会包含 user_a 的结果吗?
老师帮忙解释一下这个原理, 谢谢!