请稍等 ...
×

采纳答案成功!

向帮助你的同学说点啥吧!感谢那些助人为乐的人

关于召回数据的问题

1:目前在精排阶段选择了LR和GBDT两种方式进行精排,也就是说如果在ALS召回阶段的数据集本身存在问题,在精排阶段也无法避免,是否存在这样的问题?
2:如果再A/B测试的推荐数据逻辑中,如果实现类似下拉刷新和上滑加载更多的操作,由于AB测试中是混合数据返回,对于页码不好定位,下拉和上滑的思路应该是怎么样?

正在回答 回答被采纳积分+3

1回答

龙虾三少 2020-03-26 09:41:10

召回的结果是排序的天花板 要求召回的尽可能的多 第二个问题没办法避免 只能程序逻辑做内心操作处理

1 回复 有任何疑惑可以回复我~
  • 提问者 慕仔2266098 #1
    谢谢老师耐心回答。此处还有几个问题
    1:当一个新用户使用app时,此时没有用户行为,ALS召回有这种情况的处理方案吗?或者应该怎么处理?
    2:对于上面第二个问题,不考虑AB测试的情况下,正常情况我们目前的召回数据在存储内,此时我们上滑分页,我如果采用按GBDT排序数据集分页显示的话,那下拉刷新一般是怎么样的逻辑?类似B站的刷新和上滑分页。还有如果下拉和上滑用户把数据取光后又应该如何处理?是重新召回一批已过滤之前用户看过的数据?
    3:在企业级使用的时候,是不是一般都是实时推荐计算+离线推荐计算并存?实际计算现在的flink能否达到spark的效果?
    最后再次感谢老师百忙之中的耐心回答。
    回复 有任何疑惑可以回复我~ 2020-03-26 10:04:22
  • 龙虾三少 回复 提问者 慕仔2266098 #2
    冷启动一般都用规则推荐,不用算法,第二个问题一般用缓存,一次性搞许多条,然后内存里分页,第三个问题是有实时加离线并行的
    回复 有任何疑惑可以回复我~ 2020-08-06 17:47:08
问题已解决,确定采纳
还有疑问,暂不采纳
意见反馈 帮助中心 APP下载
官方微信