【每周一本书】之《图解Spark:核心技术与案例实战》
【数据猿导读】 本周给大家分享的《图解Spark:核心技术与案例实战》,以全新的Spark 2.0 版本为基础进行编写,全面介绍了Spark 核心及其生态圈组件技术

P:本书基于全新的Spark 2.0版本为基础进行编写,可参考价值高!
小编之前分享过:【每周一本书】之《大数据处理之道》:大数据处理技术哪家强?书中对目前几乎所有的大数据处理热门技术进行了横向对比,并分析了各个技术的应用场景。还在纠结于用什么工具处理数据的小伙伴们可以重点参考……
随着大数据技术的发展,Spark的生态圈越来越成熟,能够一站式解决类似企业场景的问题,深受企业喜爱。市场上涌现了一批关于Spark的书,甚至连Spark社区都不断壮大,成为最为活跃的大数据社区之一。但是随着Spark不断演进,从Spark1.0到Spark2.0,版本,各版本之间的差异也很大。在介绍Spark的时候,也没有把原理、代码和实例相结合,不够透彻。
本周给大家分享的《图解Spark:核心技术与案例实战》,以全新的Spark 2.0 版本为基础进行编写,全面介绍了Spark 核心及其生态圈组件技术。本书主要分三个部分:
1、基础篇。介绍了Spark诞生的背景、演进历程,以及Spark生态圈的组成,并详细介绍了如何搭建Spark实战环境。通过该环境不仅可以阅读Spark源代码,而且可以开发Spark应用程序。
2、核心篇。详细讲解Spark的编程模型、核心原理、存储原理和运行架构,在核心原理中对Spark通信机制、作业执行原理、调度算法、容错和监控管理等进行了深入分析,在分析原理和代码的同时结合实例进行演示。
3、组件篇。介绍Spark的各个组件,包括Spark SQL的即席查询、Spark Streaming的实时流处理应用、MLbase/MLlib的机器学习、GraphX的图处理、SparkR的数学计算和Alluxio的分布式内存文件系统等。
最后,作者还附上了5个纯实操性的指南:编译安装Hadoop、安装MySQL数据库、编译安装Hive、安装ZooKeeper、安装Kafka
适读人群:Spark开发人员、Spark运维人员、数据科学家和算法研究人员
目录
重要章节还结合了源代码进行讲解,看书时候要认真,不然容易漏掉哦
推荐阅读:
【每周一本书】之《大数据技术概论》:菜鸟学大数据,如果这些还不会,劝你一定要补上!
【每周一本书】之《数据新闻实战》:趁早学!这些工具,新闻人将越来越离不开
本书由 数据猿联合电子工业出版社 共同推荐
【本栏目合作伙伴】:清华大学出版社、电子工业出版社、北京师范大学出版社。
欢迎更多合作伙伴加入!也欢迎勾搭小编,微信:15737954328,备注“书”
我要评论
活动推荐more >
- 2018 上海国际大数据产业高2018-12-03
- 2018上海国际计算机网络及信2018-12-03
- 中国国际信息通信展览会将于2018-09-26
- 第五届FEA消费金融国际峰会62018-06-21
- 第五届FEA消费金融国际峰会2018-06-21
- “无界区块链技术峰会2018”2018-06-14