国产第1页_91在线亚洲_中文字幕成人_99久久久久久_五月宗合网_久久久久国产一区二区三区四区

讀書月攻略拿走直接抄!
歡迎光臨中圖網 請 | 注冊
> >>
Spark SQL大數據實例開發教程

包郵 Spark SQL大數據實例開發教程

出版社:機械工業出版社出版時間:2018-03-01
開本: 16開 頁數: 254頁
中 圖 價:¥39.3(6.7折) 定價  ¥59.0 登錄后可看到會員價
加入購物車 收藏
開年大促, 全場包郵
?新疆、西藏除外
本類五星書更多>

Spark SQL大數據實例開發教程 版權信息

  • ISBN:9787111591979
  • 條形碼:9787111591979 ; 978-7-111-59197-9
  • 裝幀:一般膠版紙
  • 冊數:暫無
  • 重量:暫無
  • 所屬分類:>>

Spark SQL大數據實例開發教程 本書特色

Spark SQL是Spark生態環境中核心和基礎的組件,是掌握Spark的關鍵所在。本書完全從企業級開發的角度出發,結合多個企業級應用案例,深入剖析Spark SQL。全書共分為8章,包括:認識Spark SQL、DataFrame原理與常用操作、Spark SQL操作多種數據源、Parquet列式存儲、Spark SQL內置函數與窗口函數、Spark SQL UDF與UDAF、Thrift Server、Spark SQL綜合應用案例。
本書可以使讀者對Spark SQL有深入徹底的理解,本書適合于Spark學習愛好者,是學習Spark SQL的入門和提高教材,也是Spark開發工程師開發過程中查閱Spark SQL的案頭手冊。

Spark SQL大數據實例開發教程 內容簡介

Spark SQL是Spark生態環境中核心和基礎的組件,是掌握Spark的關鍵所在。本書完全從企業級開發的角度出發,結合多個企業級應用案例,深入剖析Spark SQL。全書共分為8章,包括:認識Spark SQL、DataFrame原理與常用操作、Spark SQL操作多種數據源、Parquet列式存儲、Spark SQL內置函數與窗口函數、Spark SQL UDF與UDAF、Thrift Server、Spark SQL綜合應用案例。 本書可以使讀者對Spark SQL有深入徹底的理解,本書適合于Spark學習愛好者,是學習Spark SQL的入門和提高教材,也是Spark開發工程師開發過程中查閱Spark SQL的案頭手冊。

Spark SQL大數據實例開發教程 目錄



前言
第1章認識Spark SQL
1.1Spark SQL概述
1.1.1Spark SQL與DataFrame
1.1.2DataFrame與RDD的差異
1.1.3Spark SQL的發展歷程
1.2從零起步掌握Hive
1.2.1Hive的本質是什么
1.2.2Hive安裝和配置
1.2.3使用Hive分析搜索數據
1.3Spark SQL on Hive安裝與配置
1.3.1安裝Spark SQL
1.3.2安裝MySQL
1.3.3啟動Hive Metastore
1.4Spark SQL初試
1.4.1通過spark-shell來使用Spark SQL
1.4.2Spark SQL的命令終端
1.4.3Spark的Web UI
1.5本章小結
第2章DataFrame原理與常用操作
2.1DataFrame編程模型
2.2DataFrame基本操作實戰
2.2.1數據準備
2.2.2啟動交互式界面
2.2.3數據處理與分析
2.3通過RDD來構建DataFrame
2.4緩存表(列式存儲)
2.5DataFrame API應用示例
2.6本章小結
第3章Spark SQL 操作多種數據源
3.1通用的加載/保存功能
3.1.1Spark SQL加載數據
3.1.2Spark SQL保存數據
3.1.3綜合案例——電商熱銷商品排名
3.2Spark SQL操作Hive示例
3.3Spark SQL操作JSON數據集示例
3.4Spark SQL操作HBase示例
3.5Spark SQL操作MySQL示例
3.5.1安裝并啟動MySQL
3.5.2準備數據表
3.5.3操作MySQL表
3.6Spark SQL操作MongoDB示例
3.6.1安裝配置MongoDB
3.6.2啟動MongoDB
3.6.3準備數據
3.6.4Spark SQL操作MongoDB
3.7本章小結
第4章Parquet列式存儲
4.1Parquet概述
4.1.1Parquet的基本概念
4.1.2Parquet數據列式存儲格式應用舉例
4.2Parquet的Block配置及數據分片
4.2.1Parquet的Block的配置
4.2.2Parquet 內部的數據分片
4.3Parquet序列化
4.3.1Spark實施序列化的目的
4.3.2Parquet兩種序列化方式
4.4本章小結
第5章Spark SQL內置函數與窗口函數
5.1Spark SQL內置函數
5.1.1Spark SQL內置函數概述
5.1.2Spark SQL內置函數應用實例
5.2Spark SQL窗口函數
5.2.1Spark SQL窗口函數概述
5.2.2Spark SQL窗口函數分數查詢統計案例
5.2.3Spark SQL窗口函數NBA常規賽數據統計案例
5.3本章小結
第6章Spark SQL UDF與UDAF
6.1UDF概述
6.2UDF示例
6.2.1Hobby_count函數
6.2.2Combine函數
6.2.3Str2Int函數
6.2.4Wsternstate函數
6.2.5ManyCustomers函數
6.2.6StateRegion函數
6.2.7DiscountRatio函數
6.2.8MakeStruct函數
6.2.9MyDateFilter函數
6.2.10MakeDT函數
6.3UDAF概述
6.4UDAF示例
6.4.1ScalaAggregateFunction函數
6.4.2GeometricMean函數
6.4.3CustomMean函數
6.4.4BelowThreshold函數
6.4.5YearCompare函數
6.4.6WordCount函數
6.5本章小結
第7章Thrift Server
7.1Thrift概述
7.1.1Thrift的基本概念
7.1.2Thrift的工作機制
7.1.3Thrift的運行機制
7.1.4一個簡單的Thrift 實例
7.2Thrift Server的啟動過程
7.2.1Thrift Sever啟動詳解
7.2.2HiveThriftServer2類的解析
7.3Beeline操作
7.3.1Beeline連接方式
7.3.2在Beeline中進行SQL查詢操作
7.3.3通過Web控制臺查看用戶進行的操作
7.4Thrift Server應用示例
7.4.1示例源代碼
7.4.2關鍵代碼行解析
7.4.3測試運行
7.4.4運行結果解析
7.4.5Spark Web控制臺查看運行日志
7.5本章小結
第8章Spark SQL綜合應用案例
8.1綜合案例實戰——電商網站日志多維度數據分析
8.1.1數據準備
8.1.2數據說明
8.1.3數據創建
8.1.4數據導入
8.1.5數據測試和處理
8.2綜合案例實戰——電商網站搜索排名統計
8.2.1案例概述
8.2.2數據準備
8.2.3實現用戶每天搜索前3名的商品排名統計
8.3本章小結
展開全部
商品評論(0條)
暫無評論……
書友推薦
本類暢銷
編輯推薦
返回頂部
中圖網
在線客服
主站蜘蛛池模板: 久久久精品免费热线观看 | 免费国产一区二区三区四区 | 国产一级一片免费播放i | 成人三级在线播放线观看 | 自拍偷自拍亚洲精品被多人伦好爽 | www日本免费视频 | 国产无套乱子伦精彩是白视频 | 久草电影在线播放 | 亚洲国产婷婷综合在线精品 | 国产成人综合久久精品亚洲 | 激情在线视频 | 久久国产精品久久 | 夹得好湿真拔不出来了动态图 | 亚洲精品m在线观看 | 亚洲欧美日本在线 | 国产一级一片免费播放i | 亚洲av无码国产精品永久一区 | 国产911情侣拍拍在线播放 | 韩国xxxx色视频在线观看 | 精品国产污污免费网站入口 | 欧美乱人伦中文在线观看不卡 | 欧美爱爱视频网站 | 国产韩国精品一区二区三区久久 | 亚洲人成无码网www 亚洲人成无码网站 | 中文字幕在线视频在线看 | 久久久青草青青国产亚洲免观 | 东方亚洲东方欧美色二区 | 97精品人妻系列无码人妻 | 欧美亚洲综合视频 | 亚洲欧美成人一区二区在线电影 | 日韩精品久久一区二区三区 | 亚洲精品欧美精品中文字幕 | 嫩草亚洲国产精品 | 亚洲另类图片另类电影 | 男人边吃奶边揉好爽免费视频 | 欧美一区二区视频 | 婷婷综合久久中文字幕蜜桃三电影 | 国产福利在线永久视频 | 欧美亚洲国产片在线观看 | 免费被黄动漫网站在线观看下 | 国产一区视频在线 |