收藏

机器学习入门 Scikit-learn实现经典小案例

采用Python3为主讲语言,通过5个真实案例快速入门机器学习

机器学习入门 Scikit-learn实现经典小案例

难度 初级 时长 9小时 学习人数 775 综合评分 9.54
  • 第1章 机器学习概述 7 节 | 38分钟

    本章讲述了机器学习的基本概念,本门课的内容,以及在本门课中使用的一些工具安装方法和基本使用方法。

    收起列表

    • 视频: 1-1 机器学习-导学 (05:30)
    • 视频: 1-2 概述 (04:28)
    • 视频: 1-3 本门课的内容 (01:46)
    • 视频: 1-4 IPython Notebook介绍 (06:21)
    • 视频: 1-5 python 基本语法 (07:35)
    • 视频: 1-6 条件和循环语句 (07:43)
    • 视频: 1-7 Python中的函数 (03:46)
  • 第2章 回归模型—理论 10 节 | 46分钟

    本章讲述了回归模型的基本原理和算法,并结合回归介绍了交叉验证的方法。

    收起列表

    • 视频: 2-1 课前须知。 (04:36)
    • 视频: 2-2 线性回归概述 (01:34)
    • 视频: 2-3 预测房价 (03:16)
    • 视频: 2-4 线性回归 (05:15)
    • 视频: 2-5 加入更高阶的因素 (04:24)
    • 视频: 2-6 通过训练-测试分离来评估过拟合 (08:39)
    • 视频: 2-7 训练测试曲线 (04:49)
    • 视频: 2-8 加入新的特征 (02:40)
    • 视频: 2-9 其他回归示例 (04:19)
    • 视频: 2-10 回归总结 (06:11)
  • 第3章 回归模型—房价预测进阶案例 9 节 | 94分钟

    通过一个预测房价的实际例子来展示了如何实际的构建和应用回归模型。

    收起列表

    • 视频: 3-1 进阶案例介绍 (03:59)
    • 视频: 3-2 探索房屋数据集 (02:26)
    • 视频: 3-3 可视化数据集的特征 (05:14)
    • 视频: 3-4 实现回归模型 (13:57)
    • 视频: 3-5 应用线性回归模型 (15:33)
    • 视频: 3-6 使用sklearn来构建线性回归模型 (03:45)
    • 视频: 3-7 评估线性回归模型 (09:38)
    • 视频: 3-8 MSE和R2评分 (04:09)
    • 视频: 3-9 多项式拟合 (34:56)
  • 第4章 分类模型—理论 11 节 | 51分钟

    本章讲述了分类模型的基本原理和算法,并介绍了一些评估分类器好坏的方法。

    收起列表

    • 视频: 4-1 分类-分析情感 (00:53)
    • 视频: 4-2 从主题预测情感 (05:51)
    • 视频: 4-3 分类器应用 (06:06)
    • 视频: 4-4 线性分类器 (05:45)
    • 视频: 4-5 决策边界 (04:02)
    • 视频: 4-6 训练和评估分类器 (04:57)
    • 视频: 4-7 什么是好的精度 (03:57)
    • 视频: 4-8 混淆矩阵 (07:35)
    • 视频: 4-9 学习曲线 (05:57)
    • 视频: 4-10 类别概率 (02:17)
    • 视频: 4-11 分类总结 (03:07)
  • 第5章 分类模型—情感分析进阶案例 6 节 | 37分钟

    通过一个情感分析的实际例子来展示了如何实际的构建和应用分类模型。

    收起列表

    • 视频: 5-1 情感分析进阶案例-读取数据 (02:25)
    • 视频: 5-2 情感分析进阶案例-TFIDF表示 (06:24)
    • 视频: 5-3 情感分析进阶案例 - 文本预处理 (07:05)
    • 视频: 5-4 情感分析进阶案例 - 分词 (04:18)
    • 视频: 5-5 情感分析进阶案例 - 去除停用词 (03:00)
    • 视频: 5-6 情感分析进阶案例 - 构建分类器.mp4 (13:04)
  • 第6章 聚类和相似度模型—理论 11 节 | 45分钟

    本章讲述了聚类和基于相似度模型的基本原理和算法,并且介绍了文本分析中最重要的一种表示方式TF-IDF。

    收起列表

    • 视频: 6-1 聚类和相似度-文档检索 (00:46)
    • 视频: 6-2 检索感兴趣的文档 (01:18)
    • 视频: 6-3 用于测量相似度的单词计数表示 (07:26)
    • 视频: 6-4 应用TF-IDF对于重要单词进行优先级排序 (03:59)
    • 视频: 6-5 TF-IDFf文档表示 (05:02)
    • 视频: 6-6 检索相似的文档 (02:38)
    • 视频: 6-7 文档聚类 (03:09)
    • 视频: 6-8 聚类介绍 (04:40)
    • 视频: 6-9 k-均值 (04:09)
    • 视频: 6-10 其他例子 (06:01)
    • 视频: 6-11 聚类和相似度总结 (05:37)
  • 第7章 聚类和相似度模型—维基百科人物相似度案例 3 节 | 18分钟

    通过一个维基百科中的文本分析实际例子来展示了如何实际的构建和应用聚类和相似度模型。

    收起列表

    • 视频: 7-1 使用pandas来读取维基百科人物数据集 (03:43)
    • 视频: 7-2 使用sklearn来进行词袋模型表示 (06:48)
    • 视频: 7-3 使用skearn来进行tfidf表示和相似度计算 (07:26)
  • 第8章 推荐系统—理论 15 节 | 69分钟

    本章介绍了推荐系统的基本原理和方法,具体介绍常用的利用协同过滤和矩阵分解来构建推荐系统的方法,并且还介绍了如何来处理冷启动的情况。

    收起列表

    • 视频: 8-1 推荐商品 (01:30)
    • 视频: 8-2 我们在哪能见到推荐系统 (06:23)
    • 视频: 8-3 推荐的分类模型 (04:01)
    • 视频: 8-4 协同过滤 (04:29)
    • 视频: 8-5 流行物品的影响 (02:28)
    • 视频: 8-6 正规化同现矩阵 (05:26)
    • 视频: 8-7 矩阵补全问题 (05:40)
    • 视频: 8-8 通过用户和物品的特征进行推荐 (06:11)
    • 视频: 8-9 利用矩阵形式预测 (02:58)
    • 视频: 8-10 通过矩阵分解发现隐藏结构 (06:36)
    • 视频: 8-11 特征+矩阵分解 (03:21)
    • 视频: 8-12 推荐系统的性能度量 (05:30)
    • 视频: 8-13 最优推荐 (02:05)
    • 视频: 8-14 准确率-召回率曲线 (07:16)
    • 视频: 8-15 推荐系统总结 (04:04)
  • 第9章 推荐系统—构建推荐系统案例 5 节 | 31分钟

    通过一个小型的基于用户电影评分推荐系统的实践案例结束课程

    收起列表

    • 视频: 9-1 读取和探索推荐数据 (05:10)
    • 视频: 9-2 将样本分成训练集和验证集 (05:25)
    • 视频: 9-3 基于用户和商品的推荐 (07:46)
    • 视频: 9-4 推荐结果评估 (05:36)
    • 视频: 9-5 基于SVD的推荐 (06:28)
  • 第10章 深度学习—理论 8 节 | 39分钟

    本章主要对深度学习进行了一个入门的介绍,讲述了在图像检索中运用到的深度学习理论和算法,然后引申到利用深度特征的迁移学习。

    收起列表

    • 视频: 10-1 深度学习:图像搜索 (01:38)
    • 视频: 10-2 神经网络 (13:26)
    • 视频: 10-3 深度学习在计算机视觉中的应用。 (06:19)
    • 视频: 10-4 深度学习的性能 (03:20)
    • 视频: 10-5 计算机视觉中的深度学习 (01:31)
    • 视频: 10-6 深度学习的挑战 (02:45)
    • 视频: 10-7 迁移学习 (06:36)
    • 视频: 10-8 深度学习总结 (02:57)
  • 第11章 神经网络—案例部分 2 节 | 17分钟

    利用神经网络来计算XOR

    收起列表

    • 视频: 11-1 神经网络拟合XOR函数 (06:35)
    • 视频: 11-2 利用神经网络进行手写识别 (10:22)
  • 第12章 结尾章 4 节 | 25分钟

    本章是本门课程的最后一章,主要讲述了如何部署机器学习服务,和机器学习以后的发展方向,还有一些机遇和挑战。

    收起列表

    • 视频: 12-1 部署机器学习应用 (04:17)
    • 视频: 12-2 部署之后发生了什么? (08:03)
    • 视频: 12-3 机器学习的挑战 (07:37)
    • 视频: 12-4 课程总结。 (04:15)
本课程已完结


讲师

扬帆远航 数据科学家

拥有多年带领华为数据挖掘团队给全世界范围内著名运营商提供大数据解决方案的经验,工作中所带领的团队主要负责处理、挖掘和分析每天数以TB计的数据。作为一个带领拥有20人团队成功完成多个全球项目的leader,非常了解当今用途最广泛的数据挖掘、机器学习和数理统计方法,同时有着多年熟练应用各种数据挖掘平台工具和数理统计包(例如R,python和Spark)经验。

课程预览

检测到您还没有关注慕课网服务号,无法接收课程更新通知。请扫描二维码即可绑定
重新观看
意见反馈 帮助中心 APP下载
官方微信

学习咨询

选课、学习遇到问题?

扫码添加指导老师 1V1 帮助你!

添加后老师会第一时间解决你的问题