SQL Server數據挖掘與商業智能基礎及案例實戰
簡介
本書特色
前言
章節列表
精彩閱讀
下載資源
相關圖書
本書全面介紹了數據挖掘與商業智能的基本概念與原理,包括經典理論與趨勢發展,并深入敘述了各種數據挖掘的技術與典型應用。通過本書的學習,讀者可以對數據挖掘與商業智能的整體結構、概念、原理、技術和發展有深入的了解和認識。
本書共四部分:第一部分介紹數據倉庫、數據挖掘與商業智能之間的關系;第二部分對Microsoft SQL Server的整體架構進行介紹,并詳細闡述直接與數據挖掘相關的兩個服務:分析服務和報表服務;第三部分逐一闡述Microsoft SQL Server中包含的九種數據挖掘模型;第四部分提供四個數據挖掘的案例以及數據挖掘模型的評估,通過模仿練習,讀者可獲得實際的數據挖掘經驗,稍加修改就能在自己所處的領域中加以應用。
本書配有案例的相關素材文件,讀者可以從萬水書苑以及中國水利水電出版社網站下載,網址為:http://www.dgboyong.cn和http://www.waterpub.com.cn/softdown/。
本書為經臺灣碁峰資訊股份有限公司獨家授權發行的中文簡體版。本書中文簡體字版在中國大陸之專有出版權屬中國水利水電出版社所有。在沒有得到本書原版出版者和本書出版者書面許可時,任何單位和個人不得擅自摘抄、復制本書的一部分或全部以任何方式包括(資料和出版物)進行傳播。本書原版版權屬碁峰資訊股份有限公司。版權所有,侵權必究。
Microsoft商業智能中一項重要的技術為數據挖掘的分析技術,主要是在大量數據庫中尋找有意義或有價值的信息的過程。透過機器學習技術或是統計分析方法論,根據整合的資料加以分析探索,發掘出隱含在數據中的特性,通過專業領域知識(Domain Know-how)整合及解釋,從中找出合理且有用的信息,經過相關部門針對該模型的評估后,再提供給相關決策單位加以運用。
近年來,數據量的增加速度越來越快,加上商業智能的運用早已受到企業的重視。將企業累積的數據庫,透過大量的信息與相關信息的分析,更能找出顧客區分、消費行為、業務成本與效率等對企業極為重要的信息。通過商業智能的應用,使之更深入了解客戶,并可協助業務的開發以及增加在顧客管理上的有效性。
隨著知識經濟時代來臨,企業間的競爭模式從傳統的采用壓低成本與價格的殺價流血競爭,到近來倡導以創新為核心競爭力。不論哪一種策略模式,都是不斷在技術研發、制造生產、營銷銷售、客戶服務或資源分配等相關問題上,尋求問題的發生原因并嘗試找出解決方案。在不同運營階段,陸續累積的龐大數據,往往就是答案的隱身之所。因此,如何善用數據,從運營的歷史記錄中,挖掘出深藏其中的寶貴經驗(金礦),就是數據挖掘(Data Mining)的目的。
相對于其他數據庫系統或數據挖掘軟件,微軟最新推出的數據庫系統Microsoft SQL Server 2014可為您的關鍵任務應用程序提供突破性的性能、可用性和可管理性。SQL Server 2014 還針對在線事務處理(OLTP)和數據倉庫提供了把核心數據庫內置于內存中 (In-Memory)的新功能,完善了現有數據倉庫和商業智能的功能。借助這些功能,極大提升了企業在商業智能處理方面的性能與效率。然而如何充分發揮Microsoft SQL Server在商業智能應用中的效力,則需要一定的專業知識和學習過程。針對業界實務上的需求,我們編寫了這本教程,以期在實務應用和理論方法之間搭建一座橋梁。讓讀者迅速掌握現代商業智能應用的主要內容。
Chapter 1 緒論 2
1-1 商業智能 3
1-1-1 什么是商業智能 3
1-1-2 商業智能作用及意義 3
1-1-3 商業智能架構 4
1-1-4 商業智能中的挑戰 6
1-2 數據挖掘 7
1-3 大數據 9
1-3-1 何謂大數據 9
1-3-2 大數據的應用 9
1-4 云計算 10
Chapter 2 數據倉庫 13
2-1 數據倉庫定義 14
2-2 數據倉庫特性 14
2-3 數據倉庫架構 15
2-4 創建數據倉庫的目的 17
2-5 數據倉庫的運用 18
2-6 數據倉庫的管理 19
2-7 No SQL數據庫 19
2-7-1 Key-Value型數據庫 20
2-7-2 內存數據庫(In-memory Database) 20
2-7-3 文件數據庫(Document Database) 20
2-7-4 圖形數據庫(Graph Database) 20
2-8 Hadoop 21
Chapter 3 數據挖掘簡介 22
3-1 數據挖掘的定義 23
3-2 數據挖掘的重要性 23
3-3 數據挖掘的功能 23
3-4 數據挖掘的步驟 24
3-5 數據挖掘建模的標準CRISP-DM 25
3-6 數據挖掘的應用 27
3-7 數據挖掘軟件介紹 28
3-8 數據挖掘與Excel 30
Chapter 4 數據挖掘的主要方法 31
4-1 回歸分析(Regression Analysis) 32
4-1-1 簡單線性回歸分析(Simple Linear
Regression Analysis) 32
4-1-2 多元回歸分析(Multiple Regression
Analysis) 32
4-1-3 脊回歸分析(Ridge Regression
Analysis) 32
4-1-4 邏輯回歸分析(Logistic Regression
Analysis) 34
4-2 關聯規則(Association Rule) 34
4-3 聚類分析(Cluster Analysis) 34
4-4 判別分析(Discriminant Analysis) 36
4-5 神經網絡(Artificial Neural Network) 37
4-6 決策樹(Decision Tree) 39
4-7 其他分析方法 40
Chapter 5 數據挖掘與相關領域的關系 42
5-1 數據挖掘與統計分析 43
5-2 數據挖掘與數據倉庫 43
5-3 數據挖掘與知識發現(KDD) 44
5-4 數據挖掘與OLAP 45
5-5 數據挖掘與機器學習 46
5-6 數據挖掘與Web數據挖掘 46
5-7 數據挖掘、云計算與大數據 47
PART II Microsoft SQL Server概述
Chapter 6 Microsoft SQL Server中的商業智能 49
6-1 Microsoft SQL Server入門 50
6-2 關系數據倉庫 50
6-3 SQL Server 2014概述 51
6-4 SQL Server 2014技術 52
6-5 SQL Server 2014新增功能 54
Chapter 7 Microsoft SQL Server中的
數據挖掘功能 56
7-1 創建商業智能應用程序 57
7-2 Microsoft SQL Server數據挖掘功能
的優勢 59
7-2-1 易于使用 59
7-2-2 簡單而豐富的API 59
7-2-3 可伸縮性 60
7-2-4 數據挖掘算法 60
7-3 Microsoft SQL Server數據挖掘算法 61
7-4 Microsoft SQL Server可擴展性 62
7-5 Microsoft SQL Server是數據挖掘與
商業智能的結合 62
7-5-1 數據分析 62
7-5-2 報告 63
7-6 使用數據挖掘可以解決的問題 63
7-6-1 構建挖掘模型 63
7-6-2 構建數據挖掘應用程序 64
7-6-3 DMX范例 65
Chapter 8 Microsoft SQL Server的分析服務
(Analysis Services) 67
8-1 創建多維數據集的結構 68
8-2 建立和部署多維數據集 69
8-3 從模板創建自定義的數據庫 69
8-4 統一維度模型 70
8-5 基于屬性的維度 71
8-6 維度類型 72
8-7 量度組和數據視圖 72
8-8 計算效率 73
8-9 MDX腳本 74
8-10 存儲過程 75
8-11 關鍵績效指標(KPI) 75
8-12 實時商業智能 76
Chapter 9 Microsoft SQL Server的報表服務
(Reporting Services) 78
9-1 為何使用報表服務 79
9-2 報表服務的功能 80
9-2-1 制作報表 80
9-2-2 管理報表 80
9-2-3 提交報表 81
Chapter 10 Microsoft SQL Server的整合服務 83
10-1 SSIS介紹 84
10-1-1 DTS與SSIS 84
10-1-2 DTS升級到Integration Services
重點 84
10-1-3 SSIS版本 85
10-1-4 SSIS(SQL Server Integration
Service)架構圖 85
10-1-5 Integration Service數據流 85
10-1-6 SSIS Designer 87
10-1-7 數據流 87
10-1-8 控制流 88
10-2 操作示例 92
10-2-1 將Excel數據表導入SQL數據庫
中的數據表 92
10-2-2 對數據進行抽樣 103
Chapter 11 Microsoft SQL Server的
DMX語言 114
11-1 DMX語言介紹 115
11-2 DMX函數 117
11-2-1 模型建立 117
11-2-2 模型訓練 118
11-2-3 模型使用(預測) 118
11-2-4 其他函數語法 119
11-3 DMX語法 122
11-3-1 決策樹 123
11-3-2 貝葉斯概率分類 124
11-3-3 關聯規則 125
11-3-4 聚類分析 126
11-3-5 時序聚類分析 127
11-3-6 線性回歸分析 127
11-3-7 邏輯回歸 128
11-3-8 神經網絡 129
11-3-9 時序 130
11-4 DMX操作實例 131
11-4-1 分類(classification) 132
11-4-2 評估(estimation) 133
11-4-3 預測(prediction) 134
11-4-4 關聯分組(affinity grouping) 135
11-4-5 聚類分組(clustering) 136
PART III Microsoft SQL Server 中的數據挖掘模型
Chapter 12 決策樹模型 138
12-1 基本概念 139
12-2 決策樹與判別函數 139
12-3 計算方法 140
12-4 操作范例 142
Chapter 13 貝葉斯分類器 152
13-1 基本概念 153
13-2 操作范例 155
Chapter 14 關聯規則 166
14-1 基本概念 167
14-2 關聯規則的種類 168
14-3 關聯規則的算法:Apriori算法 168
14-4 操作范例 169
Chapter 15 聚類分析 179
15-1 基本概念 180
15-2 層級聚類法與動態聚類法 180
15-3 操作范例 185
Chapter 16 時序聚類 197
16-1 基本概念 198
16-2 主要算法 198
16-3 操作示例 200
Chapter 17 線性回歸模型 210
17-1 基本概念 211
17-2 一元回歸模型 212
17-2-1 模型假設及推估 212
17-2-2 回歸模型測試 215
17-3 多元回歸模型 216
17-3-1 回歸效果的評估 216
17-3-2 回歸變量的選擇 218
17-4 操作范例 219
Chapter 18 邏輯回歸模型 228
18-1 基本概念 229
18-2 logit變換與logistic分布 229
18-3 邏輯回歸模型 231
18-4 操作范例 232
Chapter 19 人工神經網絡模型 242
19-1 基本概念 243
19-2 神經網絡模型的特點 245
19-3 神經網絡模型的優劣比較 245
19-4 操作范例 247
Chapter 20 時序模型 257
20-1 基本概念 258
20-2 時序的構成 260
20-3 簡單時序的預測 266
20-4 包含趨勢與季節成分的時序預測 268
20-5 參數化的時序預測模型 270
20-6 操作范例 274
PART IV Microsoft SQL Server數據挖掘應用實例
Chapter 21 決策樹模型實例 285
Chapter 22 邏輯回歸模型實例 293
22-1 回歸模型實例一:腎細胞癌轉移
的回歸模型 294
22-2 回歸模型實例二:高中升學數據
的回歸模型 300
22-3 回歸模型實例三 306
Chapter 23 神經網絡模型實例 312
23-1 實例一:腎細胞癌轉移的神經
網絡模型 313
23-2 實例二:電信行業神經網絡模型 319
Chapter 24 時序模型實例 332
24-1 實例一:電力負載的時序模型 333
24-2 實例二:進出品貨物價值的
時序模型 338
Chapter 25 如何評估數據挖掘模型 344
25-1 評估圖節點Evaluation Chart
Node介紹 345
25-2 在SQL Server中如何評估模型 348
25-3 規則度量:支持度與可信度 353
25-4 結論 355
- 輸水管線工程風險管理 [張勇 黨亥生 著]
- 民用航空飛機標準線路施工 [主編 王志敏 陳明]
- 不息的水脈—大運河講談錄 [趙珩 著]
- 實用運籌學 [主編 邢育紅 于晉臣]
- 三峽梯級電站水資源決策支持系統研究與開發 [姚華明 潘紅忠 湯正]
- 海南黎族民俗文化鑒賞 [龐國華 著]
- 石墨烯在太赫茲及中紅外頻段電磁器件設計中的應用 [李艷秀 莊華偉 著]
- 電子技術(第二版) [主編 覃愛娜 李飛]
- 辦公自動化高級應用 [陳萍 朱曉玉]
- 信息處理技術員考試32小時通關 [薛大龍]
- 電子產品設計案例教程(微課版)—基于嘉立創EDA(專業版) [王靜 莫志宏 陳學昌 丁紅]
- C程序設計實踐教程 [劉衛國]
- C程序設計(慕課版) [劉衛國]
- Web技術開發教程(基于.NET開源MVC框架) [王合闖 韓紅玲 王青正 陳海蕊]
- 商務英語翻譯教程(筆譯)(第四版) [主編 王軍平]
- 智慧零售技術與應用 [洪旭 著]
- 建設工程法規實務 [主編 余瀅]
- 商務秘書理論與實務(第三版) [主編 張同欽]
- 程序設計基礎實踐教程(C/C++語言版) [張桂芬 葛麗娜]
- C++案例項目精講 [主編 楊國興]
- 勞動爭議處理實務 [主編 王秀卿 羅靜]
- 工程數學 [主編 郭立娟 王海]
- 語音識別理論與實踐 [主編 莫宏偉]
- 信息系統項目管理師章節習題與考點特訓(第二版) [主編 薛大龍]
- 武術基礎教程 [主編 李代勇 謝志民]
- 計算機網絡實訓教程 [主編 張浩軍 趙玉娟]
- 畫法幾何與機械制圖習題集(多學時) [主編 趙軍]
- HCIA-Datacom認證題庫分類精講 [主 編 韓立剛]
- SwiftUI完全開發 [李智威 著]
- 網絡規劃設計師備考一本通 [夏杰 編著]