用户登录
用户注册

分享至

spark书籍推荐

  • 作者: 小雅baby
  • 来源: 51数据库
  • 2020-09-22
《Spark大数据处理技术》以Spark 0.9版本为基础进行编写,是一本全面介绍Spark及Spark生态圈相关技术的书籍,是国内首本深入介绍Spark原理和架构的技术书籍。主要内容有Spark基础功能介绍及内部重要模块分析,包括部署模式、调度框架、存储管理以及应用监控;同时也详细介绍了Spark生态圈中其他的和模块,包括SQL处理引擎Shark和Spark SQL、流式处理引擎Spark Streaming、图计算框架Graphx以及分布式内存文件系统Tachyon。《Spark大数据处理技术》从概念和原理上对Spark核心框架和生态圈做了详细的解读,并对Spark的应用现状和未来发展做了一定的介绍,旨在为大数据从业人员和Spark爱好者提供一个更深入学习的。
《Spark大数据处理技术》适合任何大数据、Spark领域的从业人员阅读,同时也为架构师、开发工程师和大数据爱好者展现了一个现代大数据框架的架构原理和实现细节。相信通过学《Spark大数据处理技术》,读者能够熟悉和掌握Spark这一当前流行的大数据框架,并将其投入到生产实践中去。
《Spark大数据处理:技术、应用与性能优化》根据最新技术版本,系统、全面、详细讲解Spark的各项功能使用、原理机制、技术细节、应用方法、性能优化,以及BDAS生态系统的相关技术。
通过上面两本熟悉Spark的原理架构以及应用,想深入学习的话,还有《Apache Spark源码剖析》,它全面、系统地介绍了Spark源码,深入浅出。



  你好,很高兴为你解答。
如果是使用,本人推荐看spark各个版本的doc:documentation更加合适,还有多看微博上国内的几个contributor在微博上关于spark的讨论。如果要了解源码,可以跟进github上spark的repo:apache/spark · github,从配置sbt,编译源码,尝试修改源码开始,多看pr:pull requests · apache/spark · github。由于spark正在发展,你可以找你感兴趣的紧跟其中一方面spark sql(包括sql parser,查询优化catalyst和逻辑和物理执行计划的表示,各个物理算子的实现),mlbase(各种机器学习算法的实现)或者graphx,集中了解某一方面的原理和详细的实现过程,我想这个是学习spark最大的价值。
软件
前端设计
程序设计
Java相关