课程简历:
随着互联网、移动互联网和物联网的发展,我们已经切实地迎来了一个大数据的时代。目前对大数据的分析工具,首选的是Hadoop/Yarn平台,但目前对大数据的实时分析工具,业界公认最佳为Spark。Spark是基于内存计算的大数据并行计算框架,Spark目前是Apache软件基金会旗下,顶级的开源项目,Spark提出的DAG作为MapReduce的替代方案,兼容HDFS、Hive等分布式存储层,可融入Hadoop的生态系统,以弥补缺失MapReduce的不足,事实上已成为当前互联网企业主流的大数据实时处理工具。为解决广大系统设计人员深入研究与开发大数据实时处理的需要,培训中心特举办“大数据实时处理-基于Spark的大数据实时处理及应用技术”培训班。
培训要点:
互联网点击数据、传感数据、日志文件、具有丰富地理空间信息的移动数据和涉及网络的各类评论,成为了海量信息的多种形式。当数据以成百上千TB不断增长的时候,我们在内部交易系统的历史信息之外,需要一种基于大数据实时分析的决策模型和技术支持。
课程中结合实例,介绍图工具GraphX如何发现社交网络中的人际关系,大数据挖掘工具MLlib如何进行商品聚类和电影推荐,以及Streaming流挖掘工具,并探讨了Spark与Docker等云环境下新技术的结合,分析了其应用前景。
本课程教学过程中还提供了案例分析来帮助学员了解如何用Spark实时大数据工具来解决业界的问题,并介绍了Spark生产环境搭建的相关知识。
培训对象:
1,系统架构师、系统分析师、高级程序员、资深开发人员。
2,牵涉到大数据处理的数据中心运行、规划、设计负责人。
3,政府机关,金融保险、移动和互联网等大数据来源单位的负责人。
4,高校、科研院所牵涉到大数据与分布式数据处理的项目负责人。
更多培训课程,学习资讯,课程优惠,课程开班,学校地址等学校信息,请进入北京中科院计算所培训中心网站详细了解,咨询电话:021-63301563,咨询QQ:
你也可以留下你的联系方式,让课程老师跟你详细解答:在线咨询
业界良好信誉
优秀专职教师队伍
成绩真实
名师规划
您感兴趣的课程有优惠啦 查看更多 >>