采纳答案成功!
向帮助你的同学说点啥吧!感谢那些助人为乐的人
1:目前在精排阶段选择了LR和GBDT两种方式进行精排,也就是说如果在ALS召回阶段的数据集本身存在问题,在精排阶段也无法避免,是否存在这样的问题? 2:如果再A/B测试的推荐数据逻辑中,如果实现类似下拉刷新和上滑加载更多的操作,由于AB测试中是混合数据返回,对于页码不好定位,下拉和上滑的思路应该是怎么样?
召回的结果是排序的天花板 要求召回的尽可能的多 第二个问题没办法避免 只能程序逻辑做内心操作处理
谢谢老师耐心回答。此处还有几个问题 1:当一个新用户使用app时,此时没有用户行为,ALS召回有这种情况的处理方案吗?或者应该怎么处理? 2:对于上面第二个问题,不考虑AB测试的情况下,正常情况我们目前的召回数据在存储内,此时我们上滑分页,我如果采用按GBDT排序数据集分页显示的话,那下拉刷新一般是怎么样的逻辑?类似B站的刷新和上滑分页。还有如果下拉和上滑用户把数据取光后又应该如何处理?是重新召回一批已过滤之前用户看过的数据? 3:在企业级使用的时候,是不是一般都是实时推荐计算+离线推荐计算并存?实际计算现在的flink能否达到spark的效果? 最后再次感谢老师百忙之中的耐心回答。
冷启动一般都用规则推荐,不用算法,第二个问题一般用缓存,一次性搞许多条,然后内存里分页,第三个问题是有实时加离线并行的
登录后可查看更多问答,登录/注册
ElasticSearch实现高相关性搜索,Spark MLlib实现个性化推荐
2.6k 14
1.1k 6
1.4k 6
1.0k 6