數(shù)據(jù)挖掘算法—基于C++及CUDA C
簡介
本書特色
前言
章節(jié)列表
精彩閱讀
下載資源
相關(guān)圖書
本書是美國著名數(shù)據(jù)挖掘算法專家、數(shù)值計算專業(yè)的數(shù)理統(tǒng)計學(xué)博士Timothy Masters的最新作品。
應(yīng)用中的預(yù)測或分類使數(shù)據(jù)挖掘工程師經(jīng)常會面對成千上萬的候選特征。這些特征絕大多數(shù)沒有價值或只有很小的價值,只有與某個或某些其他特征聯(lián)合起來才可能有用;一些特征可能有巨大的預(yù)測能力,但它們又可能僅存在于整體特征空間的某些區(qū)域……數(shù)據(jù)挖掘中,類似這種使人痛苦的問題是無窮的。本書中的現(xiàn)代特征選擇技術(shù),將幫助你解決這些問題。本書中所有的算法都可被直覺證實,并有相關(guān)方程和解釋材料支撐。作者還展現(xiàn)了這些算法的完整的、受到高度好評的源代碼(下載網(wǎng)址:https://www.apress.com/cn/book/9781484259870),并對其進(jìn)行了解析。
本書適合算法、數(shù)據(jù)挖掘、人工智能等領(lǐng)域的師生及相關(guān)的技術(shù)與研究人員使用。
數(shù)值計算專家Timothy Masters 博士著作
展現(xiàn)特征提取與選擇算法的最新技術(shù)
所有算法都可被直覺證實
Timothy Masters獲得數(shù)值計算專業(yè)的數(shù)理統(tǒng)計博士學(xué)位后,一直擔(dān)任政府和行業(yè)的獨立顧問。早期研究領(lǐng)域包括高程影像的自動特征檢測,還開發(fā)了洪災(zāi)和旱災(zāi)預(yù)測,隱蔽導(dǎo)彈發(fā)射井檢測和軍用車輛識別等應(yīng)用。后來與醫(yī)學(xué)研究人員合作開發(fā)了穿刺活檢良性細(xì)胞/惡性細(xì)胞的計算鑒別算法。在過去的20年中,主要專注于金融市場交易系統(tǒng)的自動評估方法研究。撰寫了12本關(guān)于預(yù)測建模實際應(yīng)用方面的圖書:
《實用神經(jīng)網(wǎng)絡(luò)C++實現(xiàn)》(Academic,1993)
《基于神經(jīng)網(wǎng)絡(luò)的信號和圖像處理》(Wiley,1994)
《神經(jīng)網(wǎng)絡(luò)先進(jìn)算法》(Wiley,1995)
《時間序列預(yù)測的神經(jīng)網(wǎng)絡(luò)、新型和混合算法》(Wiley,1995)
《預(yù)測和分類的評估與改進(jìn)》(Apress,2018)
《深度信念網(wǎng)絡(luò)的C++和CUDA C實現(xiàn):第一卷:受限玻爾茲曼機(jī)和監(jiān)督式前饋網(wǎng)絡(luò)》(Apress,2018)
《深度信念網(wǎng)絡(luò)的C++和CUDA C實現(xiàn):第二卷:復(fù)域中的自編碼》(Apress,2018)
《深度信念網(wǎng)絡(luò)的C++和CUDA C實現(xiàn):第三卷:卷積神經(jīng)網(wǎng)絡(luò)》(Apress,2018)
《數(shù)據(jù)挖掘算法的C++實現(xiàn)》(Apress,2018)
《市場交易系統(tǒng)的測試與優(yōu)化》(Apress,2018)
《金融市場預(yù)測的可靠統(tǒng)計指標(biāo):C++算法實現(xiàn)》(KDP,2019,第2版 2020)
《交易系統(tǒng)開發(fā)的排列檢驗和隨機(jī)檢驗:C++算法實現(xiàn)》(KDP,2020)
第2章 前向選擇成分分析 3
前向選擇成分分析概述 3
數(shù)學(xué)原理與代碼示例 5
最大化解釋方差 6
方差最大化準(zhǔn)則代碼 7
后向細(xì)化 10
多線程后向細(xì)化 13
有序成分正交化 18
綜合應(yīng)用 20
僅前向選擇子集的成分變量 24
后向細(xì)化子集的成分變量 25
人工變量示例 26
第3章 局部特征選擇 30
算法概述 30
算法輸出結(jié)果 34
簡要介紹:單純形算法 34
線性規(guī)劃問題 35
Simplex類的接口 36
更多細(xì)節(jié) 37
一種更嚴(yán)格的LFS方法 38
類內(nèi)分割和類間分割 41
計算權(quán)重 43
最大化類間分割 45
最小化類內(nèi)分割 48
測試β試驗值 49
關(guān)于線程的簡要說明 52
CUDA權(quán)重計算 52
將CUDA代碼集成到算法中 53
初始化CUDA硬件 54
計算與當(dāng)前實例之差 56
計算距離矩陣 57
計算最小距離 59
計算權(quán)重方程項 63
轉(zhuǎn)置項矩陣 64
權(quán)重項求和 65
權(quán)重遷移到主機(jī) 66
局部特征選擇示例 66
關(guān)于運(yùn)行時的解釋說明 67
第4章 時間序列特征的記憶特性 68
簡單數(shù)學(xué)概述 69
前向算法 70
后向算法 72
α和β修正 74
一些常規(guī)計算 78
均值和協(xié)方差 78
概率密度 79
多元正態(tài)概率密度函數(shù) 80
啟動參數(shù) 81
初始化算法流程 81
對均值施加擾動 82
對協(xié)方差施加擾動 82
對轉(zhuǎn)移概率施加擾動 83
關(guān)于隨機(jī)數(shù)發(fā)生器的解釋 83
完整優(yōu)化算法 84
計算狀態(tài)概率 85
更新均值和協(xié)方差 87
更新初始概率和轉(zhuǎn)移概率 89
HMM在時間序列中的記憶特性評估 93
鏈接特征變量與目標(biāo)變量 96
鏈接HMM狀態(tài)與目標(biāo) 102
一個人為的不當(dāng)示例 109
一個合理可行的示例 111
第5章 逐步選擇改進(jìn)算法 113
特征評估模型 114
基本模型實現(xiàn)代碼 115
交叉驗證性能度量 118
逐步選擇算法 120
確定第一個變量 125
在現(xiàn)有模型中添加變量 127
三個算法演示示例 130
第6章 名義變量到有序變量的轉(zhuǎn)換 133
實現(xiàn)概述 135
合理關(guān)系測試 135
股票價格變動示例 136
名義變量到有序變量變換實現(xiàn)代碼 138
構(gòu)造函數(shù) 139
輸出計數(shù)表 141
計算映射函數(shù) 143
Monte-Carlo置換檢驗 145
- 輸水管線工程風(fēng)險管理 [張勇 黨亥生 著]
- 民用航空飛機(jī)標(biāo)準(zhǔn)線路施工 [主編 王志敏 陳明]
- 不息的水脈—大運(yùn)河講談錄 [趙珩 著]
- 實用運(yùn)籌學(xué) [主編 邢育紅 于晉臣]
- 三峽梯級電站水資源決策支持系統(tǒng)研究與開發(fā) [姚華明 潘紅忠 湯正]
- 海南黎族民俗文化鑒賞 [龐國華 著]
- 石墨烯在太赫茲及中紅外頻段電磁器件設(shè)計中的應(yīng)用 [李艷秀 莊華偉 著]
- 電子技術(shù)(第二版) [主編 覃愛娜 李飛]
- 辦公自動化高級應(yīng)用 [陳萍 朱曉玉]
- 信息處理技術(shù)員考試32小時通關(guān) [薛大龍]
- 電子產(chǎn)品設(shè)計案例教程(微課版)—基于嘉立創(chuàng)EDA(專業(yè)版) [王靜 莫志宏 陳學(xué)昌 丁紅]
- C程序設(shè)計實踐教程 [劉衛(wèi)國]
- C程序設(shè)計(慕課版) [劉衛(wèi)國]
- Web技術(shù)開發(fā)教程(基于.NET開源MVC框架) [王合闖 韓紅玲 王青正 陳海蕊]
- 商務(wù)英語翻譯教程(筆譯)(第四版) [主編 王軍平]
- 智慧零售技術(shù)與應(yīng)用 [洪旭 著]
- 建設(shè)工程法規(guī)實務(wù) [主編 余瀅]
- 商務(wù)秘書理論與實務(wù)(第三版) [主編 張同欽]
- 程序設(shè)計基礎(chǔ)實踐教程(C/C++語言版) [張桂芬 葛麗娜]
- C++案例項目精講 [主編 楊國興]
- 勞動爭議處理實務(wù) [主編 王秀卿 羅靜]
- 工程數(shù)學(xué) [主編 郭立娟 王海]
- 語音識別理論與實踐 [主編 莫宏偉]
- 信息系統(tǒng)項目管理師章節(jié)習(xí)題與考點特訓(xùn)(第二版) [主編 薛大龍]
- 武術(shù)基礎(chǔ)教程 [主編 李代勇 謝志民]
- 計算機(jī)網(wǎng)絡(luò)實訓(xùn)教程 [主編 張浩軍 趙玉娟]
- 畫法幾何與機(jī)械制圖習(xí)題集(多學(xué)時) [主編 趙軍]
- HCIA-Datacom認(rèn)證題庫分類精講 [主 編 韓立剛]
- SwiftUI完全開發(fā) [李智威 著]
- 網(wǎng)絡(luò)規(guī)劃設(shè)計師備考一本通 [夏杰 編著]