HBase分布式存儲系統應用

-
【作 者】胡鑫喆 張志剛
【I S B N 】978-7-5170-6891-4
【責任編輯】張玉玲
【適用讀者群】本專通用
【出版時間】2018-10-15
【開 本】16開
【裝幀信息】平裝(光膜)
【版 次】第1版第1次印刷
【頁 數】192
【千字數】292
【印 張】12
【定 價】¥32
【叢 書】普通高等教育數據科學與大數據技術專業教材
【備注信息】
簡介
本書特色
前言
章節列表
精彩閱讀
下載資源
相關圖書
本書通過原理加案例的方式系統講解了HBase分布式存儲系統應用,精心安排了HBase原理和架構分析、環境搭建、案例開發、優化策略等環節,使讀者對解決相關問題有清晰的思路。
全書共8章:前7章系統講解HBase模型和系統架構、數據讀寫流程、環境搭建、HBase Shell、程序開發、高級特性;第8章是HBase MapReduce實例,通過實例幫助讀者進一步理解HBase應用和MapReduce編程。全書脈絡清晰,實例新穎實用,內容詳實。
本書可作為普通高校大數據相關專業的HBase教材,可供深入了解HBase編程的讀者參考,還可作為相關培訓班的培訓教材。
本書通過原理加案例的方式系統講解HBase分布式存儲系統應用,精心安排了HBase原理和架構分析、環境搭建、案例開發、優化策略等環節,全書脈絡清晰,案例新穎實用,道理直觀,內容詳實。
大數據帶來了各種各樣繁雜的數據,我們不僅要呈現世界,更重要的是通過呈現來處理更龐大的數據,理解各種各樣的數據集合,表現多維數據之間的關聯。換句話說,就是歸納數據內在的模式、關聯和結構。
由于大數據的存儲量極大,因此其存儲設備需要具有高擴展性、高可用性、自動容錯和低成本等特點。常見的存儲形式有分布式文件系統和分布式數據庫,分布式文件系統采用大規模的分布式存儲節點來滿足存儲大量文件的需求,而分布式的非關系型數據庫則為大規模非結構化數據的處理和分析提供支持。
目前常見的非關系型數據庫主要有Redis、Tokyo Cabinet、MongoDB、CouchDB、Cassandra、Voldemort和HBase等。本書將對HBase進行深入研究和探討,其他非關系型數據庫讀者可以參考相關書籍。本書共8章,具體內容如下:
第1章介紹關系型數據庫和非關系型數據庫的區別、HBase的使用場景。
第2章介紹HBase的邏輯模型、物理模型和系統架構。
第3章詳細講解HRegionServer、HRegion和HBase數據讀寫流程。
第4章介紹HBase的分布式環境搭建。
第5章介紹如何通過HBase Shell完成表的管理、數據的增刪改查和數據遷移。
第6章介紹創建表、數據插入、數據查詢等基本操作,然后對Scan查詢、Filter過濾、行數統計、NameSpace開發、計數器、協處理器和HBase快照等高級應用進行介紹。
第7章介紹HBase表設計、列族設計優化、讀寫性能優化策略、HBase集群規劃。
第8章講解HBase MapReduce編程實例。
本書的編寫得到北京百知教育科技有限公司的大力支持,在此表示感謝。
由于時間倉促及編者水平有限,書中難免有疏漏甚至錯誤之處,懇請廣大讀者批評指正。
編 者
2018年7月
1.1 面向行和面向列存儲對比 1
1.1.1 面向行存儲的數據庫 1
1.1.2 面向列存儲的數據庫 2
1.1.3 兩種存儲方式的對比 2
1.2 HDFS分布式存儲的特點 3
1.3 HBase的使用場景 5
1.4 本章小結 6
第2章 HBase模型和系統架構 7
2.1 HBase的相關概念 7
2.2 HBase的邏輯模型 8
2.3 HBase的物理模型 10
2.4 HBase的特點 10
2.5 HBase的系統架構 11
2.5.1 Client 11
2.5.2 ZooKeeper 12
2.5.3 HMaster 12
2.5.4 HRegionServer 12
2.5.5 HRegion 13
2.6 本章小結 13
第3章 HBase數據讀寫流程 15
3.1 HRegionServer詳解 15
3.1.1 WAL 16
3.1.2 MemStore 17
3.1.3 BlockCache 18
3.1.4 HFile 18
3.1.5 HRegionServer的恢復 23
3.1.6 HRegionServer的上線下線 24
3.2 HRegion 24
3.2.1 HRegion分配 25
3.2.2 HRegion Split 25
3.2.3 HRegion Compact 25
3.3 HMaster上線 26
3.4 數據讀流程 26
3.5 數據寫流程 28
3.6 刪除數據流程 28
3.7 本章小結 28
第4章 HBase環境搭建 30
4.1 ZooKeeper的安裝 30
4.2 HBase的安裝 31
4.3 本章小結 35
第5章 HBase Shell 36
5.1 HBase Shell啟動 36
5.2 表的管理 37
5.3 表數據的增刪改查 44
5.4 HBase數據遷移的importtsv的使用 48
5.5 本章小結 49
第6章 HBase程序開發 50
6.1 表的相關操作 50
6.2 創建Configuration對象 54
6.3 創建表 55
6.3.1 開發環境配置 56
6.3.2 創建表 58
6.4 數據插入 60
6.5 數據查詢 67
6.6 數據刪除 71
6.7 Scan查詢 75
6.8 Filter過濾 84
6.9 行數統計 105
6.10 NameSpace開發 107
6.11 計數器 111
6.12 協處理器 115
6.13 HBase快照 126
6.14 本章小結 131
第7章 HBase高級特性 132
7.1 HBase表設計 132
7.2 列族設計優化 136
7.3 寫性能優化策略 138
7.4 讀性能優化策略 139
7.4.1 HBase客戶端優化 139
7.4.2 HBase服務器端優化 140
7.4.3 HDFS相關優化 141
7.5 HBase集群規劃 142
7.5.1 集群業務規劃 142
7.5.2 集群容量規劃 143
7.5.3 Region規劃 144
7.5.4 內存規劃 145
7.6 本章小結 149
第8章 MapReduce On HBase 150
8.1 HBase MapReduce 150
8.2 編程實例 151
8.2.1 使用MapReduce操作HBase 151
8.2.2 從HBase獲取數據上傳至HDFS 154
8.2.3 MapReduce生成HFile入庫
到HBase 156
8.2.4 同時寫入多張表 160
8.2.5 從多個表讀取數據 164
8.2.6 通過讀取HBase表刪除Hbase
數據 166
8.2.7 通過讀取HBase表數據復制到
另外一張表 169
8.2.8 建立HBase表索引 170
8.2.9 將MapReduce輸出結果到MySQL 174
8.2.10 利用MapReduce完成MySQL
數據讀寫 179
8.3 本章小結 182
附錄 MySQL安裝 183
- 輸水管線工程風險管理 [張勇 黨亥生 著]
- 民用航空飛機標準線路施工 [主編 王志敏 陳明]
- 不息的水脈—大運河講談錄 [趙珩 著]
- 實用運籌學 [主編 邢育紅 于晉臣]
- 三峽梯級電站水資源決策支持系統研究與開發 [姚華明 潘紅忠 湯正]
- 海南黎族民俗文化鑒賞 [龐國華 著]
- 石墨烯在太赫茲及中紅外頻段電磁器件設計中的應用 [李艷秀 莊華偉 著]
- 電子技術(第二版) [主編 覃愛娜 李飛]
- 辦公自動化高級應用 [陳萍 朱曉玉]
- 信息處理技術員考試32小時通關 [薛大龍]
- 電子產品設計案例教程(微課版)—基于嘉立創EDA(專業版) [王靜 莫志宏 陳學昌 丁紅]
- C程序設計實踐教程 [劉衛國]
- C程序設計(慕課版) [劉衛國]
- Web技術開發教程(基于.NET開源MVC框架) [王合闖 韓紅玲 王青正 陳海蕊]
- 商務英語翻譯教程(筆譯)(第四版) [主編 王軍平]
- 智慧零售技術與應用 [洪旭 著]
- 建設工程法規實務 [主編 余瀅]
- 商務秘書理論與實務(第三版) [主編 張同欽]
- 程序設計基礎實踐教程(C/C++語言版) [張桂芬 葛麗娜]
- C++案例項目精講 [主編 楊國興]
- 勞動爭議處理實務 [主編 王秀卿 羅靜]
- 工程數學 [主編 郭立娟 王海]
- 語音識別理論與實踐 [主編 莫宏偉]
- 信息系統項目管理師章節習題與考點特訓(第二版) [主編 薛大龍]
- 武術基礎教程 [主編 李代勇 謝志民]
- 計算機網絡實訓教程 [主編 張浩軍 趙玉娟]
- 畫法幾何與機械制圖習題集(多學時) [主編 趙軍]
- HCIA-Datacom認證題庫分類精講 [主 編 韓立剛]
- SwiftUI完全開發 [李智威 著]
- 網絡規劃設計師備考一本通 [夏杰 編著]