這是我們東坡下載為大家?guī)?lái)的一篇中文的Spark快速數(shù)據(jù)處理中文版電子書(shū),采用的pdf格式,內(nèi)容完整,講解Spark的使用方法,包括如何在多種機(jī)器上安裝Spark,如何配置一個(gè)Spark集群等,有需要的朋友們可以來(lái)我們東坡免費(fèi)的下載使用!
Spark快速數(shù)據(jù)處理圖書(shū)目錄
譯者序
作者簡(jiǎn)介
前言
第1章 安裝Spark以及構(gòu)建Spark集群
1.1 單機(jī)運(yùn)行Spark
1.2 在EC2上運(yùn)行Spark
1.3 在ElasticMapReduce上部署Spark
1.4 用Chef(opscode)部署Spark
1.5 在Mesos上部署Spark
1.6 在Yarn上部署Spark
1.7 通過(guò)SSH部署集群
1.8 鏈接和參考
1.9 小結(jié)
第2章 Sparkshell的使用
2.1 加載一個(gè)簡(jiǎn)單的text文件
2.2 用Sparkshell運(yùn)行邏輯回歸
2.3 交互式地從S3加載數(shù)據(jù)
2.4 小結(jié)
第3章 構(gòu)建并運(yùn)行Spark應(yīng)用
3.1 用sbt構(gòu)建Spark作業(yè)
3.2 用Maven構(gòu)建Spark作業(yè)
3.3 用其他工具構(gòu)建Spark作業(yè)
3.4 小結(jié)
第4章 創(chuàng)建SparkContext
4.1 Scala
4.2 Java
4.3 Java和Scala共享的API
4.4 Python
4.5 鏈接和參考
4.6 小結(jié)
第5章 加載與保存數(shù)據(jù)
5.1 RDD
5.2 加載數(shù)據(jù)到RDD中
5.3 保存數(shù)據(jù)
5.4 連接和參考
5.5 小結(jié)
第6章 操作RDD
6.1 用Scala和Java操作RDD
6.2 用Python操作RDD
6.3 鏈接和參考
6.4 小結(jié)
第7章 Shark-Hive和Spark的綜合運(yùn)用
7.1 為什么用HiveShark
7.2 安裝Shark
7.3 運(yùn)行Shark
7.4 加載數(shù)據(jù)
7.5 在Spark程序中運(yùn)行HiveQL查詢(xún)
7.6 鏈接和參考
7.7 小結(jié)
第8章 測(cè)試
8.1 用Java和Scala測(cè)試
8.2 用Python測(cè)試
8.3 鏈接和參考
8.4 小結(jié)
第9章 技巧和竅門(mén)
9.1 日志位置
9.2 并發(fā)限制
9.3 內(nèi)存使用與垃圾回收
9.4 序列化
9.5 IDE集成環(huán)境
9.6 Spark與其他語(yǔ)言
9.7 安全提示
9.8 郵件列表
9.9 鏈接和參考
9.10 小結(jié)
Spark快速數(shù)據(jù)處理pdf預(yù)覽
- PC官方版
- 安卓官方手機(jī)版
- IOS官方手機(jī)版