vlambda博客
学习文章列表

【数据安全推荐书籍5】Spark快速大数据分析

Spark快速大数据分析


内容简介

本书由 Spark 开发者及核心成员共同打造,讲解了网络大数据时代应运而生的、能高效迅

捷地分析处理数据的工具——Spark,它带领读者快速掌握用 Spark 收集、计算、简化和保存海

量数据的方法,学会交互、迭代和增量式分析,解决分区、数据本地化和自定义序列化等问题。

本书适合大数据时代所有需要进行数据分析的人员阅读。



本书特色

本书结构清晰,章节是按照从前到后依次阅读的顺序组织的。在每一章的开头,我们会说

明本章中的哪些小节对于数据科学家们更重要,而哪些小节则对于工程师们更为有用。话

虽如此,我们还是希望书中的所有内容对两类读者都能有一定的帮助。

前两章将会带你入门,让你在自己的电脑上搭好一个基础的 Spark,并且让你对于用 Spark

能做什么有一个基本的概念。等我们弄明白了 Spark 的目标和 Spark 的安装之后,就会着

重介绍 Spark shell。Spark shell 是开发 Spark 应用原型时非常有用的工具。后续几章则会详

细介绍 Spark API、如何将 Spark 应用运行在集群上,以及 Spark 所提供的更高层的程序库

支持,例如 SQL(数据库支持)和 MLlib(机器学习库)



下载链接

链接:https://pan.baidu.com/s/1yg3xRvwLZB0DKNrNvw2cJg

提取码:imi1



CISP资料库房

关注CISP资料库获取更多资讯