欧美一级特黄aaaaaaa在线观看-欧美一级特黄aaaaaa在线看片-欧美一级特黄aa大片-欧美一级特黄刺激大片视频-深夜久久-深夜激情网站

熱門關鍵字:  聽力密碼  聽力密碼  新概念美語  單詞密碼  巧用聽寫練聽力
圖書信息

SQL Server 2005數據挖掘實例分析

中國水利水電出版社
    【作 者】王欣 等編著 【I S B N 】978-7-5084-5346-0 【責任編輯】宋俊娥 【適用讀者群】本科 【出版時間】2008-03-01 【開 本】16開本 【裝幀信息】平裝(光膜) 【版 次】2008年03月第1版 【頁 數】256 【千字數】 【印 張】 【定 價】28 【叢 書】21世紀高等院校計算機系列教材 【備注信息】
圖書詳情

      數據挖掘的目的在于使用所發現的模式幫助解釋當前的行為或預測未來的結果。數據挖掘過程涉及下列7個研究方面:數據倉庫及OLAP技術、數據預處理、使用SQL Server Data Mining、關聯規則、分類和預測、聚類分析和時序和序列數據的挖掘。

      本書對數據挖掘和知識發現的各個方面都進行了必要的解說,側重于用SSAS進行數據挖掘模型的建立、挖掘結果的分析與檢驗,以及解釋與驗證結果。本書對主要的挖掘技術提供了詳細的SQL Server2005數據挖掘的實例,讀者通過案例來實驗性地建立和檢驗數據挖掘模型。 

      本書適合希望學習SQL Server2005挖掘技術的讀者,可以作為數據挖掘工程師的參考用書。本書適合作為高校教學數據挖掘的教程,也是公司培訓不可多得的參考用書。

      隨著計算機技術,特別是數據庫技術的快速發展和廣泛應用,各行各業積累的數據量越來越大,傳統的數據處理方式已經很難充分利用蘊藏在這些數據中的有用知識,于是數據挖掘技術應運而生。

      數據挖掘(Data Mining)又稱為數據庫中的知識發現,可以把數據轉化為有用的信息以幫助制定決策,從而在市場競爭中獲得優勢地位。數據挖掘是一個過程——一個不斷把商業經驗和知識與數據相結合的過程。數據挖掘的目標是找到能夠幫助他們做出對其成功至關重要的決策的信息。例如,他們想知道這樣一些情況:“現在客戶中哪些會對我們的新產品感興趣?”,“這個貸款申請有合理的信用風險嗎?”等等。數據挖掘中應用的方法包括概念描述、分類與預測、關聯規則、聚集和神經網絡等。

    基于數據挖掘技術,微軟公司于2005年12月2日發布了新一代企業級應用平臺   SQL Server 2005、Visual Studio 2005。使用 SQL Server 2005 Analysis Services (SSAS)可以很方便地創建復雜的數據挖掘解決方案。SSAS工具提供了設計、創建和管理數據挖掘模型的功能,并且使客戶端能夠訪問數據及挖掘數據。

      數據挖掘的目的在于使用所發現的模式幫助解釋當前的行為或預測未來的結果。數據挖掘過程涉及下列7個研究方面:數據倉庫及OLAP技術、數據預處理、使用SQL Server Data Mining、關聯規則、分類和預測、聚類分析及時序和序列數據的挖掘。

      本書對數據挖掘和知識發現的各個方面都進行了必要的解說,側重于用SSAS進行數據挖掘模型的建立、挖掘結果的分析與檢驗,以及解釋與驗證結果。為了更好地理解數據挖掘過程,本書對主要的挖掘技術提供了詳細的SQL Server 2005數據挖掘的實例,讀者通過實例來實驗性地建立和檢驗數據挖掘模型。

    本書讀者

    本書闡述了數據挖掘的部分原理以及使用SSAS進行數據挖掘的基本方法和各種可視化工具。本書還針對不同的挖掘模型設計了實用的案例,幫助讀者深入理解數據挖掘和熟悉SSAS。對于數據挖掘的用戶而言,本書將成為他們的入門工具和實踐指南。相信大多數數據庫管理人員、IT專業人員和數據挖掘方面的學生都會從本書中獲益。

    本書內容

    全書分為9個章節,細致地講解了SQL Server 2005數據挖掘的原理和實務,幫助讀者快速入門學習深奧的數據挖掘知識。本書的內容包括:

    第1章  數據挖掘基本知識:提供關于數據挖掘的多學科領域的導論,討論導致需要數據挖掘的數據庫技術的發展道路和數據挖掘應用的重要性;考察挖掘的數據類型,包括關系、事務和數據倉庫數據,以及復雜數據類型,如數據流、時間序列、序列、圖形、社會網絡和多重關系數據、時空數據、多媒體數據、文本數據以及Web數據;根據所挖掘的知識類型,對數據挖掘任務進行一般分類。

    第2章  數據倉庫及OLAP技術:介紹了數據倉庫和聯機分析處理的基本概念、系統結構和一般實現,以及數據倉庫和數據挖掘的關系;更深入地考察數據倉庫和OLAP技術,詳細地研究數據立方體的計算方法;討論數據倉庫和OLAP的進一步探查,如發現驅動的立方體探查,復雜數據挖掘查詢的多特征立方體和立方體梯度分析;討論另一種數據泛化和概念描述方法——面向屬性的歸納。

    第3章  數據預處理:介紹挖掘之前的數據預處理技術,包括描述性數據匯總的各種統計方法,包括數據的中心趨勢和散布的度量。加強了數據清理方法的介紹,討論了數據集成和變換、數據歸約的方法,包括動態和靜態離散化概念分層的使用;介紹概念分層的自動產生。

    第4章  使用SQL Server 2005進行數據挖掘:通過Business Intelligence Development Studio的使用,數據源、數據源視圖、數據挖掘對象的管理,數據查看及模型評估,介紹SSAS的特性以及設計、創建和管理數據挖掘模型的功能。

    第5章  關聯規則:介紹挖掘關系數據庫中的頻繁模式、關聯和相關性的方法。除介紹諸如購物籃分析等基本概念外,進一步介紹了關聯規則挖掘模型。通過完整的實例闡述了  關聯規則的挖掘步驟以及結果分析。

    第6章  分類和預測:介紹數據分類和預測方法,包括決策樹歸納、貝葉斯分類、后向傳播的神經網絡技術。還介紹了  決策樹挖掘模型、  貝葉斯挖掘模型、  神經網絡挖掘模型。通過決策樹、神經網絡兩個實例介紹完整的挖掘方法和結果分析。

    第7章  聚類分析:主要介紹數據的聚類方法,包括劃分方法、層次方法、基于密度的方法等。通過對  聚類挖掘模型及基于該模型的案例的介紹,闡述如何利用  聚類挖掘技術進行挖掘、分析、可靠性檢驗等。

    第8章  時序和序列數據的挖掘:主要討論流數據、時間序列數據和序列數據(包括事務序列和生物學序列)的挖掘,簡要介紹了  順序分析挖掘模型。

    第9章  數據挖掘的應用和發展趨勢:總結本書介紹的概念,并討論數據挖掘的應用和發展趨勢。添加了一些新的數據挖掘材料,涉及生物學和生物醫學數據分析、其他科學應用、入侵檢測和協同過濾。除了具有挑戰性的研究問題之外,還討論了數據挖掘對社會的影響,如隱私和數據安全問題。

    本書特色

      簡單而詳細的例子。本書通過列舉不同數據挖掘技術如何建立模型的簡單、詳細的例子,揭去了數據挖掘的神秘面紗。

      章節之間是獨立的,讀者可以按自己的興趣選擇閱讀順序,實現按需閱讀,提高問題的解決能力。

      精選數據挖掘經典分析方向,核心講解必要的原理,將深奧的數據挖掘原理淺顯地講解出來。

      與實際分析項目結合,全書以作者從事的實際分析項目為藍本,講解復雜數據挖掘的具體實踐。

    致謝

      本書由王欣(西南交通大學)、徐騰飛、唐連章編著,姚新軍負責前期的策劃和后期質量監控。王欣從事數據倉庫與數據挖掘領域的教學、研究與應用工作,對SSAS有著豐富的實踐經驗和獨特的理解。在本書的編寫過程中,參與具體工作的還有萬雷、王斌、厲劍梁、殷世欽、江廣順、李強、吳志俊、杜長城、余松、劉羽宇、郭敏、董茜、陳鯤、王曉、陳洪軍、余偉煒、王呼佳、許志清、張賽橋、夏惠軍。還要感謝中國水利水電出版社計算機編輯室的老師們的辛苦努力,正是因為你們辛苦的付出,才使本書能在第一時間和讀者見面。

      本書的內容涉及面廣,專業性強,雖幾經斟酌,多方查找資料,但由于作者水平有限,難免有錯誤和不當之處,敬請各位讀者批評指正。

    前言
    第1章  數據挖掘基本知識 1
    1.1  數據挖掘的概念 1
    1.2  數據挖掘的存儲對象 4
    1.2.1  關系數據庫 4
    1.2.2  數據倉庫 7
    1.2.3  事務數據庫 9
    1.2.4  高級數據庫系統和高級數據庫應用 10
    1.3  基本數據挖掘任務 14
    1.3.1  特征和區分 14
    1.3.2   關聯分析 14
    1.3.3  分類和預測 15
    1.3.4  聚類分析 15
    1.3.5  局外者分析 15
    1.4  數據挖掘系統的分類 15
    1.5  數據挖掘的主要問題 16
    第2章  數據倉庫及OLAP技術 20
    2.1  數據倉庫的概念 20
    2.1.1  數據倉庫的定義 20
    2.1.2  數據倉庫的建立 21
    2.1.3  操作數據庫系統與數據倉庫的區別 22
    2.1.4  分離的數據倉庫 23
    2.2  多維數據模型 24
    2.2.1  由表和電子數據表到數據方 24
    2.2.2  多維數據庫模式 26
    2.2.3  定義星型、雪花和星座的實例 29
    2.2.4  度量的計算 30
    2.2.5  概念分層 32
    2.2.6  多維數據模型上的OLAP操作 34
    2.2.7  多維數據庫的星型查詢模型 36
    2.3  數據倉庫的系統結構 37
    2.3.1  數據倉庫的設計步驟和結構 37
    2.3.2  三層數據倉庫結構 39
    2.3.3  OLAP服務器類型(ROLAP、MOLAP、HOLAP)的比較 41
    2.4  數據倉庫實現 43
    2.4.1  數據方的有效計算 43
    2.4.2  索引OLAP數據 48
    2.4.3  OLAP查詢的有效處理 50
    2.4.4  元數據存儲 51
    2.4.5  數據倉庫后端工具和實用程序 52
    2.5  數據方技術的進一步發展 52
    2.5.1  數據方發現驅動的探查 53
    2.5.2  多粒度上的復雜聚集:多特征方 55
    2.5.3  其他進展 57
    2.6  由數據倉庫到數據挖掘 58
    2.6.1  數據倉庫的使用 58
    2.6.2  由聯機分析處理到聯機分析挖掘 59
    第3章  數據預處理 62
    3.1  數據預處理的重要性 62
    3.2  數據清洗 64
    3.2.1  遺漏數據處理 64
    3.2.2  噪聲數據處理 64
    3.2.3  不一致數據處理 66
    3.3  數據集成與轉換 66
    3.3.1  數據集成處理 66
    3.3.2  數據轉換處理 67
    3.4  數據消減 69
    3.4.1  數據立方合計 70
    3.4.2  維數消減 71
    3.4.3  數據塊消減 72
    3.5  離散化和概念層次樹生成 75
    3.5.1  數值概念層次樹生成 76
    3.5.2  類別概念層次樹生成 78
    第4章  使用SQL Server 2005進行數據挖掘 81
    4.1  關于Business Intelligence Development Studio 81
    4.1.1  關于用戶界面 81
    4.1.2  聯機模式和離線模式 83
    4.1.3  如何創建數據挖掘對象 87
    4.2  對數據源進行設置 87
    4.2.1  數據源 87
    4.2.2  使用數據源視圖 90
    4.3  創建和編輯模型 101
    4.3.1  挖掘結構與模型 102
    4.3.2  使用數據挖掘向導 102
    4.3.3  創建MovieClick的數據挖掘結構和模型 106
    4.3.4  使用數據挖掘設計器 110
    4.4  處理 113
    4.5  使用模型 115
    4.5.1  掌握模型查看器 115
    4.5.2  使用挖掘準確性圖表 118
    4.5.3  在MovieClick上建立提升圖 121
    4.5.4  使用【挖掘模型預測】窗口 123
    4.5.5  創建數據挖掘報告 124
    第5章  關聯規則 125
    5.1  關聯規則簡介 125
    5.1.1  購物籃分析 126
    5.1.2  關聯規則挖掘路線 127
    5.2  關聯規則挖掘算法 128
    5.2.1  Apriori算法:使用候選項集找頻繁項集 128
    5.2.2  由頻繁項集產生關聯規則 130
    5.2.3  提高Apriori的有效性 131
    5.3  Microsoft關聯規則挖掘模型簡介 133
    5.4  Microsoft關聯規則挖掘模型的使用 134
    5.4.1  挖掘問題的提出 134
    5.4.2  數據準備 135
    5.4.3  挖掘模型簡介 137
    5.4.4  挖掘操作流程 138
    5.4.5  挖掘結果分析 147
    第6章  分類和預測 148
    6.1  分類與預測的內涵 148
    6.2  有關分類和預測的若干問題 150
    6.3  基于決策樹的分類 151
    6.3.1  決策樹生成算法 152
    6.3.2  樹剪枝 155
    6.3.3  由決策樹提取分類規則 157
    6.4  Microsoft決策樹挖掘模型簡介 158
    6.5  Microsoft決策樹挖掘模型的使用 159
    6.5.1  挖掘問題的提出 160
    6.5.2  數據準備 160
    6.5.3  挖掘模型簡介 161
    6.5.4  挖掘操作流程 161
    6.5.5  挖掘結果分析 169
    6.6  貝葉斯分類 169
    6.6.1  貝葉斯定理 170
    6.6.2  樸素貝葉斯定理 170
    6.6.3  Microsoft貝葉斯挖掘模型簡介 172
    6.6.4  Microsoft貝葉斯挖掘模型的使用 172
    6.6.5  挖掘結果分析 174
    6.7  神經網絡 175
    6.7.1  神經網絡概述 175
    6.7.2  前饋神經網絡 176
    6.7.3  Microsoft神經網絡挖掘模型簡介 180
    6.7.4  挖掘操作流程 181
    6.7.5  挖掘結果分析 183
    第7章  聚類分析 185
    7.1  聚類的概念 185
    7.2  聚類分析中的數據類型 187
    7.2.1  區間標度(Interval-Scaled)變量 188
    7.2.2  二元(Binary)變量 188
    7.2.3  標稱型、序數型和比例標度型變量 188
    7.2.4  混合類型的變量 189
    7.3  主要聚類方法的分類 190
    7.3.1  劃分方法 190
    7.3.2  層次方法 193
    7.3.3  基于密度的方法 195
    7.3.4  基于網格的方法 197
    7.3.5  基于模型的方法 198
    7.4  Microsoft聚類挖掘模型簡介 199
    7.4.1  典型的劃分方法 199
    7.4.2  算法參數 202
    7.5  Microsoft聚類挖掘模型的使用 205
    7.5.1  挖掘問題的提出 206
    7.5.2  數據準備 206
    7.5.3  挖掘模型簡介 207
    7.5.4  挖掘操作流程 207
    7.5.5  挖掘結果分析 211
    第8章  時序和序列數據的挖掘 214
    8.1  時序數據的挖掘 214
    8.1.1  時序分析中的相似性搜索 214
    8.1.2  Microsoft時序分析挖掘模型簡介 217
    8.1.3  Microsoft時序分析挖掘模型的使用 220
    8.2  序列數據聚類 221
    8.2.1  Microsoft順序分析挖掘模型簡介 222
    8.2.2  Microsoft順序分析挖掘模型的使用 225
    第9章  數據挖掘的應用和發展趨勢 227
    9.1  數據挖掘的應用 227
    9.1.1  針對生物醫學和DNA數據分析的數據挖掘 227
    9.1.2  針對金融數據分析的數據挖掘 229
    9.1.3  零售業中的數據挖掘 230
    9.1.4  電信業中的數據挖掘 231
    9.2  數據挖掘系統產品和研究原型 231
    9.2.1  怎樣選擇一個數據挖掘系統 232
    9.2.2  商用數據挖掘系統的例子 234
    9.3  數據挖掘的其他主題 234
    9.3.1  視頻和音頻數據挖掘 235
    9.3.2  科學和統計數據挖掘 235
    9.3.3  數據挖掘的理論基礎 236
    9.3.4  數據挖掘和智能查詢應答 237
    9.4  數據挖掘的社會影響 238
    9.5  數據挖掘的發展趨勢 242
    參考文獻 244





最新評論共有 0 位網友發表了評論
發表評論
評論內容:不能超過250字,需審核,請自覺遵守互聯網相關政策法規。
用戶名: 密碼:
匿名?
注冊
主站蜘蛛池模板: 国产精品深夜福利免费观看| 在线播放黄| 五月综合视频| 精品视频在线观看| 91精品免费国产高清在线| 欧洲一区二区| www.色哟哟| 欧美性生活网站| 91在线九色| 欧美特级视频| 亚洲伊人久久网| 国产在线看不卡一区二区| 一区二区三区在线播放| 国内精品久久影院| 亚洲一区免费在线| 91中文字幕在线一区| 国产在线播放成人免费| 欧美成成人免费| 2021久久精品国产99国产| 玖玖99视频| 重福利影院| 极品丝袜高跟91极品系列| 愉拍自拍一区首页| 91久久打屁股调教网站| 劲爆欧美第1页婷婷| 男啪女色黄无遮挡免费视频| 中文字幕日韩理论在线| 99久久国产综合精品国| 久久精彩| 亚洲网美女| 丁香六月天婷婷| 欧美日韩中文亚洲另类春色| 亚洲乱码一二三四区国产| 国产极品自拍| 青青草原播放器| 午夜大片免费完整在线看| 在线播放亚洲视频| 91福利影院| 国产一级又裸又黄又裸又| 日韩在线二区| 91黄色大片|