介绍课程相关背景,学习建议等等
Storm作为近几年Hadoop生态圈很火爆的大数据实时流处理框架,是成为大数据研发工程师必备的技能之一。 本章将从如下几个方面让大家对于Storm有宏观上的认识:什么是Storm、Storm的发展史、Storm对比Hadoop的区别、Storm对比Spark Streaming的区别、Storm的优势、Storm应用现状及发展趋势、Storm应用案例分享...
本章节将从如下几个方面带大家深入理解Storm的核心概念:初识Storm核心概念、通过日常生活的案例来理解Storm的核心概念、根据官网的描述来理解Storm核心概念、最后通过画图讲解的方式讲解Storm的核心概念。相信通过多角度对比进行讲解Storm的核心概念,让大家掌握的更加深刻。因为Storm的核心概念的理解是后续Storm课程学习...
本章节将手把手带大家搭建基于IDEA+Maven的Storm的开发环境,通过案例融合Storm编程中常用API的使用以及开发过程中的注意事项。
本章节将带领大家学习Storm周边常用框架的使用,比如:ZooKeeper、Kafka、Logstash、以及Logstash与Kafka的整合使用。
本章节将学习Storm的架构以及各个核心组件的功能、并搭建Storm的单机环境和分布式环境、如何提交/查看/杀死Storm作业、Storm UI界面参数介绍
本章节将重点讲解Storm的优化中的核心:并行度调整(worker数量、executor数量、task数量),将通过对代码的修改并提交到Storm环境上去运行,结合Storm UI上展示的参数效果来进行调优,让大家对于Storm的并行度有更加深入的理解,本章节是学习和面试过程中重中之重,务必掌握。...
本章节将带来大家通过代码以及UI参数展现的方式来学习Storm中的常用分组策略:Shuffle分组策略、Field分组策略、All分组策略。本章节也是Storm开发过程中务必要掌握的部分。
本章节将从如下方面来讲解Storm框架的可靠性:Worker进程、Supervisor进程、nimbus进程、节点、以及消息处理的确认机制(ack/fail)。本章节是面试过程中经常会被考核到的。
本章节将讲解什么是RPC机制、Hadoop中的RPC使用介绍、如何开发Storm的基于本地和远程模式的DPRC编程
本章节将讲解Storm如何整合Redis、JDBC、HDFS、HBase、ES等常用的大数据框架综合使用。在生产环境中,Storm都是需要整合周边框架一起配合使用,各自完成自己的职责,进而完成大数据的实时流处理项目
本章节将带领大家使用Logstash+Kafka+Storm+高德地图来实现基于一个交通数据的热力图的实时展示项目,通过该项目使得大家能够具备和掌握如何使用Storm来架构一个实时流处理项目的能力
十二年互联网公司一线研发经验,担任大数据技术专家。主要从事基于Spark/Flink为核心打造的大数据公有云、私有云数据平台产品的研发。改造过Hadoop、Spark等框架的源码为云平台提供更高的执行性能。集群规模过万,有丰富的大数据项目实战经验以及授课经验(授课数千小时,深受学员好评)。
如无法下载使用图片另存为
下载海报选课、学习遇到问题?
扫码添加指导老师 1V1 帮助你!
添加后老师会第一时间解决你的问题