/ 实战 / Spark2.x+协同过滤算法,开发企业级个性化推荐系统
收藏

基于Spark2.x开发企业级个性化推荐系统

聚焦算法原理,搭建企业级系统,给大数据开发工程师的刚需课

Spark2.x+协同过滤算法,开发企业级个性化推荐系统

难度 中级 时长 15小时 学习人数 223 综合评分 9.93

Spark2.x+协同过滤算法,开发企业级个性化推荐系统

¥388.00
全部展开
  • 第1章 课程介绍与学习指南 试看

    本节主要进行课程的介绍,学习路线与指南,如何更好的学习本课程?为什么要学习本课程,学习本课程具体能收获什么?

    共 3 节 (7分钟) 收起列表

    • 1-1 课程介绍及导学 (06:32) 试看
    • 1-2 怎么更好的使用慕课平台
    • 1-3 你真的会问问题吗?
  • 第2章 了解推荐系统的生态 试看

    本章带你了解推荐系统的生态,让你从思维上重塑对推荐系统的认知。了解推荐系统是由哪些关键元素支撑的,推荐算法的分类以及什么才算一个好的推荐系统

    共 5 节 (53分钟) 展开列表

    • 2-1 本章重难点提点
    • 2-2 推荐系统的关键元素和思维模式 (11:49) 试看
    • 2-3 推荐算法的主要分类 (14:07)
    • 2-4 推荐系统常见的问题 (09:05)
    • 2-5 推荐系统效果评测 (17:55)
  • 第3章 给学习算法打基础 试看

    本章回顾并梳理了学习算法必需的数学知识和统计学知识,帮助大家巩固基础,平滑过渡,为后面学习推荐算法做铺垫。

    共 3 节 (30分钟) 展开列表

    • 3-1 本章重点难点提点
    • 3-2 推荐系统涉及的数学知识 (11:25) 试看
    • 3-3 推荐系统涉及的概率统计知识 (17:58)
  • 第4章 详解协同过滤推荐算法原理

    本章介绍推荐算法中最常用也最受欢迎的协同过滤推荐算法。首先巩固学习协同过滤特有的数学基础,然后分别从推荐算法的三个类型:基于用户,基于物品,基于模型来展开,并且对它们进行代码演示。

    共 12 节 (165分钟) 展开列表

    • 4-1 本章重点难点提点
    • 4-2 本章作业 (04:17)
    • 4-3 协同过滤的数学知识:最小二乘法 (15:01)
    • 4-4 协同过滤的数学知识:梯度下降法 (23:55)
    • 4-5 协同过滤的数学知识:余弦相似度 (14:09)
    • 4-6 什么是user-based的协同过滤 (15:26)
    • 4-7 基于Spark实现user-based协同过滤 (14:12)
    • 4-8 什么是item-based协同过滤 (16:32)
    • 4-9 基于Spark实现item-based协同过滤 (13:03)
    • 4-10 基于模型的协同过滤 (04:49)
    • 4-11 基于矩阵分解模型的两种算法:SVD和PMF (18:49)
    • 4-12 缺失值填充 (24:39)
  • 第5章 Spark内置推荐算法ALS原理

    本章讲解Spark内置的推荐算法:ALS。从算法原理、Spark上实现、源码阅读,这3个方面全面讲解ALS算法。

    共 3 节 (37分钟) 展开列表

    • 5-1 ALS 算法原理 (05:52)
    • 5-2 ALS 算法在Spark上的实现 (18:51)
    • 5-3 ALS 算法在 Spark 上的源码分析 (11:28)
  • 第6章 推荐系统搭建——需求分析和环境搭建

    开始进行推荐系统的实操了!大家准备好了吗?这章我们进行对整个推荐系统做一个需求分析。并且手把手带领环境搭建。

    共 5 节 (30分钟) 展开列表

    • 6-1 本章重点难点提点
    • 6-2 项目需求分析 技术分解 模块设计 (04:43)
    • 6-3 开发环境搭建 (19:13)
    • 6-4 环境问题 工具问题 版本问题 (05:44)
    • 6-5 【实操手册】环境搭建文档 ( 完善版 )
  • 第7章 推荐系统搭建——UI界面模块

    先从简单内容起步,一般大数据开发工程师主要负责数据的收集和分析,这里为了演示方便我们制作了简单的前端页面,使用了 VUE、Element-UI和EChatrs

    共 4 节 (53分钟) 展开列表

    • 7-1 VUE+ElementUI简单入门 (14:08)
    • 7-2 用户访问页面实现 (11:48)
    • 7-3 AB Test 控制台页面(上) (13:24)
    • 7-4 AB Test 控制台页面(下) (13:23)
  • 第8章 推荐系统搭建——数据层

    做好前期准备,终于步入正轨了,大家是不是都按耐不住了?本章将带领大家开发项目的数据层的部分,分别实现数据采集、清洗、分析等功能。

    共 6 节 (88分钟) 展开列表

    • 8-1 数据上报(上) (18:07)
    • 8-2 数据上报(下) (13:57)
    • 8-3 日志清洗和格式化数据(上) (17:13)
    • 8-4 日志清洗和格式化数据(中) (15:28)
    • 8-5 日志清洗和格式化数据(下) (15:07)
    • 8-6 分析用户行为和商品属性 (07:30)
  • 第9章 推荐系统搭建——推荐引擎

    本章将要介绍本次项目的重难点,推荐引擎模块的搭建。主要讲解推荐模块的几个核心:召回,过滤,特征计算和排序。逐步完成实时推荐架构的搭建。

    共 11 节 (188分钟) 展开列表

    • 9-1 基于用户行为构建评分矩阵 (09:52)
    • 9-2 离线推荐:基于用户角度召回策略筛选候选集(上) (22:20)
    • 9-3 离线推荐:基于用户角度召回策略筛选候选集(下) (21:57)
    • 9-4 离线推荐:基于物品角度召回策略筛选候选集(上) (23:11)
    • 9-5 离线推荐:基于物品角度召回策略筛选候选集(下) (21:55)
    • 9-6 离线推荐:写特征向量到HBase (07:13)
    • 9-7 离线推荐:基于模型的排序 (12:22)
    • 9-8 实时推荐:Storm解析用户行为 (17:04)
    • 9-9 实时推荐:通过FTRL更新特征权重-原理 (13:33)
    • 9-10 实时推荐:通过FTRL更新特征权重-代码实现 (26:06)
    • 9-11 离线推荐和实时推荐项目梳理 (12:07)
  • 第10章 推荐系统搭建——推荐结果存储

    本章演示个性化推荐系统的评估模块的搭建。主要是介绍主流的测试模块A/B测试,逐步开发搭建一个完整的A/B测试后台

    共 3 节 (30分钟) 展开列表

    • 10-1 数仓ODS和DWD层搭建 (09:23)
    • 10-2 搭建用户行为日志数据仓库 (10:17)
    • 10-3 利用外部分区表存储用户行为 (09:43)
  • 第11章 推荐系统搭建——推荐效果评估模块

    本章演示个性化推荐系统收尾环节,评估模块的搭建。主要介绍主流的测试模块A/BTest,逐步搭建一个完整的A/B测试后台

    共 5 节 (48分钟) 展开列表

    • 11-1 AB Test (05:12)
    • 11-2 AB Test的分流管理 (06:26)
    • 11-3 搭建AB Test 实验控制台(上) (18:01)
    • 11-4 搭建AB Test 实验控制台(下) (11:57)
    • 11-5 常用评测指标 (05:37)
  • 第12章 知识拓展——基于关联规则的推荐算法

    本章讲解两个主要的关联规则推荐算法,Apriori和FP-Growth,并通过Spark去演示这两个算法的实现。

    共 5 节 (75分钟) 展开列表

    • 12-1 基于Apriori的关联算法 (07:17)
    • 12-2 基于Spark实现Apriori算法(上) (18:24)
    • 12-3 基于Spark实现Apriori算法(下) (21:52)
    • 12-4 基于FP-Growth的关联算法 (13:09)
    • 12-5 基于Spark实现FP-Growth算法 (13:26)
  • 第13章 知识拓展——基于机器学习的推荐算法

    本章主要讲解主流的基于机器学习的推荐算法。首先介绍RBM随机网络原理,接着分别展示基于 RBN、CNN、RNN的推荐算法,演示如何实现。

    共 3 节 (27分钟) 展开列表

    • 13-1 RBM神经网络 (06:02)
    • 13-2 CNN卷积神经网络 (08:41)
    • 13-3 RNN循环神经网络 (11:34)
  • 第14章 知识拓展——基于内容的推荐算法

    本章主要介绍主流的基于内容的推荐算法,分别介绍TF-IDF算法、文本向量化、用户行为向量化和长期模型。最后对所有算法知识以及课程项目进行一个总结和展望。

    共 3 节 (39分钟) 展开列表

    • 14-1 文本向量化 (09:54)
    • 14-2 基于Spark实现TF-IDF (16:29)
    • 14-3 课程总结 (12:01)
本课程已完结

试看

全部试看小节



讲师

小简同学 全栈工程师

6年大数据开发挖掘经验,目前在一线大数据分析平台服务供应商,担任推荐系统项目负责人。负责的项目日均日志量达2T,企业核心业务指标比原来提升20%。主持过多个的内部技术分享。

课程预览

检测到您还没有关注慕课网服务号,无法接收课程更新通知。请扫描二维码即可绑定
重新观看
意见反馈 帮助中心 APP下载
官方微信

学习咨询

选课、学习遇到问题?

扫码添加指导老师 1V1 帮助你!

添加后老师会第一时间解决你的问题