七大真实赛题案例实操,一课打通kaggle竞赛常见关卡
学习范围广,覆盖kaggle竞赛大部分知识点;包含主题多,四大赛题领域逐一击破
结构化数据
即时反馈内核竞赛
IEEE-CIS欺诈检测
训练目的:
深入结构化比赛,掌握数据分析和特征工程
赛题内容:
构建模型对未知的测试集分类预测
赛题知识点:
EDA探索性数据分析、XGBoost和LightGBM使用
训练目的:
匿名金融风控比赛,带你掌握N种数据特征工程方法
赛题内容:
深入特征工程,对欺诈交易进行识别
赛题知识点:
高阶特征工程、模型集成
文本处理
Quora充分文本检测
即时反馈内核竞赛
训练目的:
经典的文本匹配比赛,带你掌握多种文本处理方法
赛题内容:
入门NLP,对Quora重复提问进行划分
赛题知识点:
词向量、文本匹配模型、Bert
训练目的:
超难文本分类问题,掌握前沿文本分类模型
赛题内容:
深入NLP,对Quora有害或虚假问题进行分类
赛题知识点:
Bert pretrain与finetune,对抗训练
语音识别
康奈尔鸟叫声识别
训练目的:
经典的语音识别比赛,掌握语音识别特征提取与建模
赛题内容:
根据鸟叫声识别物种
赛题知识点:
mfcc和log mel,语音数据扩增方法
图像识别
谷歌涂鸦识别挑战
即钢铁缺陷检测时反馈内核竞赛
训练目的:
简单有趣的图像分类比赛,如何逐步提升网络模型精度
赛题内容:
使用CNN模型完成涂鸦图案识别
赛题知识点:
CNN模型搭建、数据扩增方法、深度学习训练技巧
训练目的:
工业级别的缺陷检测比赛,带你掌握语义分割模型
赛题内容:
搭建语义分割模型识别钢材图像上缺陷
赛题知识点:
语义分割模型、数据扩增方法、注意力机制
Kaggle TOP级排名 的数据大神带你快速玩转竞赛
自身经验+大神思路+获奖方案,扫平竞赛各种疑难杂“坑”