发布网友 发布时间:2022-04-22 03:41
共3个回答
热心网友 时间:2023-12-02 05:29
在这4章中,RDD、RDD和spark集成战斗用例API的作用类型将用于实际的战斗RDD。
第四章分析了星火模式的设计与实现、星火集群模型和星火客户端模式。
这说明了一步一步的火花的特点是使用了大约30个实际案例,并分析了spark GraphX的源代码。
附录从spark的角度解释了Scala,并详细解释了Scala函数编程和面向对象编程。
热心网友 时间:2023-12-02 05:29
今天的市场上有那么多的 Spark 书。
本文梳理比较值得关注的 Spark ,图书市场上,重要的是要注意,这些书都写基于 Spark 0.9或1.0,一定距离最新版本的 Spark ,这是因为图书出版周期长。技术资料,完成(书籍内容已经完成,和修改后的)最后的距离)也需要3个月上市,这意味着,这本书的内容可能不是最新的,三个月后,可能已经发布了N版本,特别是对于 Spark 源代码分析书,将会变得更糟。
目前,Spark books主要是由做平台的人编写的,
这些人非常了解Spark原理,所以这些书是由内部原理来分析的。如果您想要找到一本关于spark的书,它应用了实际的战斗类型,特别是程序开发、程序优化和案例分析,我很抱歉,但它仍然是空白的。《 Spark 大数据处理技术》以 Spark 版0.9为基础,是对Spark和Spark生态系统相关技术书籍的全面介绍,是国内第一个深入介绍Spark原理和技术书籍的架构。
主要内容包括Spark基本功能介绍和内部重要模块分析,包括部署模式、调度框架、存储管理和应用监控;此外,还详细介绍了生态系统和其他软件模块的Spark,包括Shark和Spark SQL SQL处理引擎、流处理引擎Spark流图、图形计算框架和Tachyon分布式内存文件系统。“ Spark 大数据处理技术。
最后
从 Spark 核心框架的概念和原理和生态系统,和火花的应用现状做了介绍和发展在未来,针对大型数据从业人员学习和火花爱好者提供一个平台,更先进的研究。
热心网友 时间:2023-12-02 05:30
学编程的人不要以为一辈子只能打代码,你们有很多我们一辈子比不上的优势
基本功
我的许多下属被我的手下调到管理部门,他们中的一些人开始沉默寡言,沉默寡言,没有人觉得他们会管理,但姐把这类人培养成严谨甚至冷血的干将工作忙没多少时间,之前没有多少编程基础,数学仅仅停留在大学的概率论,英语不好看英文版会疯,所以这份书单很适合时间不多,数学没基础,看不懂英文的朋友,这本书就是《spark快速大数据分析》。200页左右,很适合初学者。
提升
有一个笑话是没有详细说明的,因为这本书不是一本关于火花的入门书,是一本应用书,很多情况需要跟踪,姐当时零基础想学数据分析,是逆推回去学的,从复习高数概率论到机器学习入门,再慢慢熟悉spark然后深入研究机器学习,都是利用下班空闲时间做的。这本书就是《spark高级数据分析》
官方版
一定要阅读官方文件。官方文件很好,比大多数都好。spark更新太快了,市面上书都是基于spark1.2以前的版本,而最新的1.4和以前的版本已经有了相当大的改变。尤其是dataframe,mllib,改动非常大。
我的同事写了一本书,但他推荐我去看官方文件。由于spark的更新速度非常快,所以需要半年的时间才能完成写作,而且很多内容需要更新。