在课程中我们使用了numpy等相应工具实现了协同过滤算法,不过在实际工作中往往数据规模非常大,难以在一台机器上完成训练。
Spark作为侧重机器学习的大数据框架给我们提供了一个非常方便的协同过滤算法接口: ALS (https://spark.apache.org/docs/2.2.0/ml-collaborative-filtering.html)
该文档中已经有非常详细的用法说明和例子了,希望同学们自行学习,并且使用Spark ALS实现协同过滤。
在课程中我们使用了numpy等相应工具实现了协同过滤算法,不过在实际工作中往往数据规模非常大,难以在一台机器上完成训练。
Spark作为侧重机器学习的大数据框架给我们提供了一个非常方便的协同过滤算法接口: ALS (https://spark.apache.org/docs/2.2.0/ml-collaborative-filtering.html)
该文档中已经有非常详细的用法说明和例子了,希望同学们自行学习,并且使用Spark ALS实现协同过滤。
数据加载中...