數據挖掘算法—基于C++及CUDA C

簡介
本書特色
前言
章節列表
精彩閱讀
下載資源
相關圖書
本書是美國著名數據挖掘算法專家、數值計算專業的數理統計學博士Timothy Masters的最新作品。
應用中的預測或分類使數據挖掘工程師經常會面對成千上萬的候選特征。這些特征絕大多數沒有價值或只有很小的價值,只有與某個或某些其他特征聯合起來才可能有用;一些特征可能有巨大的預測能力,但它們又可能僅存在于整體特征空間的某些區域……數據挖掘中,類似這種使人痛苦的問題是無窮的。本書中的現代特征選擇技術,將幫助你解決這些問題。本書中所有的算法都可被直覺證實,并有相關方程和解釋材料支撐。作者還展現了這些算法的完整的、受到高度好評的源代碼(下載網址:https://www.apress.com/cn/book/9781484259870),并對其進行了解析。
本書適合算法、數據挖掘、人工智能等領域的師生及相關的技術與研究人員使用。
數值計算專家Timothy Masters 博士著作
展現特征提取與選擇算法的最新技術
所有算法都可被直覺證實
Timothy Masters獲得數值計算專業的數理統計博士學位后,一直擔任政府和行業的獨立顧問。早期研究領域包括高程影像的自動特征檢測,還開發了洪災和旱災預測,隱蔽導彈發射井檢測和軍用車輛識別等應用。后來與醫學研究人員合作開發了穿刺活檢良性細胞/惡性細胞的計算鑒別算法。在過去的20年中,主要專注于金融市場交易系統的自動評估方法研究。撰寫了12本關于預測建模實際應用方面的圖書:
《實用神經網絡C++實現》(Academic,1993)
《基于神經網絡的信號和圖像處理》(Wiley,1994)
《神經網絡先進算法》(Wiley,1995)
《時間序列預測的神經網絡、新型和混合算法》(Wiley,1995)
《預測和分類的評估與改進》(Apress,2018)
《深度信念網絡的C++和CUDA C實現:第一卷:受限玻爾茲曼機和監督式前饋網絡》(Apress,2018)
《深度信念網絡的C++和CUDA C實現:第二卷:復域中的自編碼》(Apress,2018)
《深度信念網絡的C++和CUDA C實現:第三卷:卷積神經網絡》(Apress,2018)
《數據挖掘算法的C++實現》(Apress,2018)
《市場交易系統的測試與優化》(Apress,2018)
《金融市場預測的可靠統計指標:C++算法實現》(KDP,2019,第2版 2020)
《交易系統開發的排列檢驗和隨機檢驗:C++算法實現》(KDP,2020)
第2章 前向選擇成分分析 3
前向選擇成分分析概述 3
數學原理與代碼示例 5
最大化解釋方差 6
方差最大化準則代碼 7
后向細化 10
多線程后向細化 13
有序成分正交化 18
綜合應用 20
僅前向選擇子集的成分變量 24
后向細化子集的成分變量 25
人工變量示例 26
第3章 局部特征選擇 30
算法概述 30
算法輸出結果 34
簡要介紹:單純形算法 34
線性規劃問題 35
Simplex類的接口 36
更多細節 37
一種更嚴格的LFS方法 38
類內分割和類間分割 41
計算權重 43
最大化類間分割 45
最小化類內分割 48
測試β試驗值 49
關于線程的簡要說明 52
CUDA權重計算 52
將CUDA代碼集成到算法中 53
初始化CUDA硬件 54
計算與當前實例之差 56
計算距離矩陣 57
計算最小距離 59
計算權重方程項 63
轉置項矩陣 64
權重項求和 65
權重遷移到主機 66
局部特征選擇示例 66
關于運行時的解釋說明 67
第4章 時間序列特征的記憶特性 68
簡單數學概述 69
前向算法 70
后向算法 72
α和β修正 74
一些常規計算 78
均值和協方差 78
概率密度 79
多元正態概率密度函數 80
啟動參數 81
初始化算法流程 81
對均值施加擾動 82
對協方差施加擾動 82
對轉移概率施加擾動 83
關于隨機數發生器的解釋 83
完整優化算法 84
計算狀態概率 85
更新均值和協方差 87
更新初始概率和轉移概率 89
HMM在時間序列中的記憶特性評估 93
鏈接特征變量與目標變量 96
鏈接HMM狀態與目標 102
一個人為的不當示例 109
一個合理可行的示例 111
第5章 逐步選擇改進算法 113
特征評估模型 114
基本模型實現代碼 115
交叉驗證性能度量 118
逐步選擇算法 120
確定第一個變量 125
在現有模型中添加變量 127
三個算法演示示例 130
第6章 名義變量到有序變量的轉換 133
實現概述 135
合理關系測試 135
股票價格變動示例 136
名義變量到有序變量變換實現代碼 138
構造函數 139
輸出計數表 141
計算映射函數 143
Monte-Carlo置換檢驗 145
- 輸水管線工程風險管理 [張勇 黨亥生 著]
- 民用航空飛機標準線路施工 [主編 王志敏 陳明]
- 不息的水脈—大運河講談錄 [趙珩 著]
- 實用運籌學 [主編 邢育紅 于晉臣]
- 三峽梯級電站水資源決策支持系統研究與開發 [姚華明 潘紅忠 湯正]
- 海南黎族民俗文化鑒賞 [龐國華 著]
- 石墨烯在太赫茲及中紅外頻段電磁器件設計中的應用 [李艷秀 莊華偉 著]
- 電子技術(第二版) [主編 覃愛娜 李飛]
- 辦公自動化高級應用 [陳萍 朱曉玉]
- 信息處理技術員考試32小時通關 [薛大龍]
- 電子產品設計案例教程(微課版)—基于嘉立創EDA(專業版) [王靜 莫志宏 陳學昌 丁紅]
- C程序設計實踐教程 [劉衛國]
- C程序設計(慕課版) [劉衛國]
- Web技術開發教程(基于.NET開源MVC框架) [王合闖 韓紅玲 王青正 陳海蕊]
- 商務英語翻譯教程(筆譯)(第四版) [主編 王軍平]
- 智慧零售技術與應用 [洪旭 著]
- 建設工程法規實務 [主編 余瀅]
- 商務秘書理論與實務(第三版) [主編 張同欽]
- 程序設計基礎實踐教程(C/C++語言版) [張桂芬 葛麗娜]
- C++案例項目精講 [主編 楊國興]
- 勞動爭議處理實務 [主編 王秀卿 羅靜]
- 工程數學 [主編 郭立娟 王海]
- 語音識別理論與實踐 [主編 莫宏偉]
- 信息系統項目管理師章節習題與考點特訓(第二版) [主編 薛大龍]
- 武術基礎教程 [主編 李代勇 謝志民]
- 計算機網絡實訓教程 [主編 張浩軍 趙玉娟]
- 畫法幾何與機械制圖習題集(多學時) [主編 趙軍]
- HCIA-Datacom認證題庫分類精講 [主 編 韓立剛]
- SwiftUI完全開發 [李智威 著]
- 網絡規劃設計師備考一本通 [夏杰 編著]