Python機器學習技術與應用
-
【作 者】主 編 王路漫 齊惠穎
【I S B N 】978-7-5226-1100-6
【責任編輯】趙佳琦
【適用讀者群】本科
【出版時間】2023-02-08
【開 本】16開
【裝幀信息】平裝(光膜)
【版 次】第1版第1次印刷
【頁 數】240
【千字數】384
【印 張】15
【定 價】¥49
【叢 書】普通高等教育人工智能專業系列教材
【備注信息】
簡介
本書特色
前言
章節列表
精彩閱讀
下載資源
相關圖書
內 容 提 要
本書以機器學習初學者為教學對象,通過講解機器學習的常用方法及實際應用,培養讀者機器學習應用技能及計算思維能力。本書共12章,主要內容包括機器學習概述、Python語言基礎、網絡爬蟲、數據預處理與特征工程、多元回歸分析、分類方法、支持向量機、樸素貝葉斯方法、聚類分析方法、人工神經網絡與深度學習、數據可視化、基于Pyecharts的大數據可視化圖表。
本書內容豐富、圖文并茂,以數據分析流程為主線,算法與應用相結合,系統講解常用的機器學習理論和分析方法,通過案例幫助讀者快速掌握機器學習相關技術,以實現理論與實踐的緊密結合。
本書可以作為高等學校各類專業的機器學習通識課程教材,或計算機類專業學生的必修課教材,也可供對機器學習感興趣的相關人員閱讀。
本書配有習題答案,讀者可從中國水利水電出版社網站(www.waterpub.com.cn)或萬水書苑網站(www.dgboyong.cn)免費下載。
內容全面 循序漸進地引導讀者掌握機器學習的常用方法。
案例實用 以實際問題為案例,提升計算思維能力。
資源豐富 講解視頻、程序源碼、習題答案等資源,方便讀者學習使用。
前 言
機器學習是人工智能的一個重要分支,被廣泛應用于大數據相關的諸多領域,深入推動了各個行業的創新與變革。對于當今的高校學生,全面理解且有效運用機器學習方法是十分必要的。面對新時代的發展需求,為培養學生應對時代變革所需的能力,從2015年開始北京大學醫學部面向本科生和研究生開設多門機器學習相關選修課,同時將機器學習的相關內容融入到本科生的“大學計算機”這門必修課中。多位老師花費大量時間和精力進行課程的建設和改革,形成完整的教學內容及豐富的案例式教學課程資源,這些課程深受學生的喜愛。因此我們反復對課程實施過程中的教學資源及教學經驗進行梳理總結,并編寫整理成書,為更多高校的教育教學提供參考。
本書面向各領域的實際問題需求,以培養學生的計算思維能力為目標,以全新的視角組織內容,按照數據分析的流程,通過機器學習方法和應用實踐相結合的方式深入講解常用算法。
本書既注重思維培養,又兼顧應用需求,在通俗易懂的前提下,追求知識體系的系統性,盡可能全面展示機器學習的方法及應用。
本書具有以下特點:
1. 內容全面。以機器學習的角度,按照數據分析的流程組織內容,循序漸進地引導讀者掌握機器學習的常用方法,逐步培養讀者的數據素養。
2. 案例實用。本書選用實際問題作為案例,以Python語言為載體,讓讀者通過簡單的代碼輕松實現機器學習的整個過程,解決實際問題,快速獲得計算思維能力的提升。
3. 資源豐富。本書提供重點例題的講解視頻⒊絳蛟綽搿⑾疤獾榷嘀紙萄ё試矗枋櫓邢嚶ξ恢玫畝肟梢栽諳吖劭礎⒀啊�
4. 作者團隊優秀。編寫本書的教師都具有多年的一線教學經驗,本書重難點突出,能夠激發學生的學習熱情。
本書由王路漫、齊惠穎任主編,張愛桃、王靜、殷蜀梅、周瑜任副主編。參編人員撰寫任務情況如下:第1、6、11章由王路漫編寫,第2章由王晨編寫,第3章由齊惠穎編寫,第4章由楊莉編寫,第5、8章由張愛桃編寫,第7、10章由王靜編寫,第9章由周瑜編寫,第12章由殷蜀梅編寫。王路漫、周瑜和焦影倩共同完成本書的統稿和定稿工作。
此外,中國水利水電出版社的有關負責同志對本書的出版給予了大力支持,特別是周益丹副編審,在本書的策劃和寫作中,提出了寶貴的意見,在此深表感謝。
由于編者水平有限,書中難免出現遺漏和不當之處,敬請讀者提出寶貴建議,批評指正!
王路漫
2022年6月
第1章 機器學習概述 1
1.1 機器學習的概念 1
1.2 機器學習的分類 2
1.2.1 實際問題的分類 2
1.2.2 根據訓練方法進行分類 2
1.3 機器學習的開發流程 3
1.4 機器學習的應用 4
本章小結 6
習 題 6
第2章 Python語言基礎 7
2.1 Python語言概述 7
2.1.1 Python簡介 7
2.1.2 Python優勢 7
2.2 Python環境配置與使用 8
2.2.1 Anaconda的安裝方法 8
2.2.2 Spyder的環境介紹 12
2.2.3 第三方庫的安裝方法 13
2.3 數據分析相關庫的介紹 15
2.3.1 NumPy庫 15
2.3.2 Pandas庫 19
2.3.3 Sklearn庫 22
本章小結 24
習 題 24
第3章 網絡爬蟲 26
3.1 網絡爬蟲基本知識 26
3.1.1 網絡爬蟲簡介 26
3.1.2 HTTP協議 28
3.1.3 HTML語言 32
3.1.4 CSS樣式表 33
3.1.5 JavaScript腳本 34
3.2 網頁內容獲取方法 35
3.2.1 requests主要方法 35
3.2.2 response對象 39
3.3 網頁內容解析方法 40
3.3.1 BeautifulSoup 40
3.3.2 正則表達式 46
3.4 數據存儲 50
3.4.1 TXT格式存儲 51
3.4.2 JSON格式存儲 51
3.4.3 CSV格式存儲 52
3.4.4 圖片文件存儲 52
本章小結 52
習 題 53
第4章 數據預處理與特征工程 54
4.1 數據預處理的主要方法 54
4.1.1 刪除數據 54
4.1.2 缺失值處理 56
4.1.3 重復值處理 60
4.1.4 異常值處理 62
4.1.5 數據類型的轉換 62
4.2 特征選擇的主要方法 64
4.2.1 過濾法 64
4.2.2 包裹法 67
4.2.3 嵌入法 68
4.3 數據預處理與特征工程綜合實例
——Titanic生存分析 68
本章小結 73
習 題 73
第5章 多元回歸分析 75
5.1 多元線性回歸 75
5.1.1 線性回歸的基本原理 75
5.1.2 多元線性回歸的實現 79
5.1.3 回歸模型的評估指標 81
5.2 多重共線性問題 83
5.2.1 多重共線性的定義 83
5.2.2 嶺回歸 85
5.2.3 Lasso回歸 89
5.3 非線性回歸——多項式回歸 91
5.3.1 多項式回歸的基本概念 92
5.3.2 多項式回歸的實現 93
5.4 Logistic回歸 94
5.4.1 Logistic回歸模型 94
5.4.2 Logistic回歸參數估計 96
5.4.3 Logistic回歸評估指標 98
5.4.4 應用實例 100
本章小結 103
習 題 103
第6章 分類方法 106
6.1 分類方法概述 106
6.2 決策樹 107
6.2.1 決策樹方法的基本概念 107
6.2.2 決策樹方法的工作方式 108
6.2.3 屬性選擇的度量 109
6.2.4 決策樹算法——ID3算法 110
6.2.5 Sklearn中決策樹算法的實現 110
6.2.6 決策樹算法應用實例 113
6.3 隨機森林 117
6.3.1 隨機森林概述 117
6.3.2 Sklearn中隨機森林算法的實現 118
6.3.3 隨機森林算法應用實例 118
6.4 分類算法評估 122
6.4.1 評估準則 122
6.4.2 評估過程 122
6.4.3 評估方法 123
6.4.4 評估實例 124
本章小結 125
習 題 125
第7章 支持向量機 126
7.1 支持向量機算法概述 126
7.2 SVM的分類實現方法及案例 129
7.2.1 SVC支持向量分類算法 129
7.2.2 NuSVC支持向量分類算法 131
7.2.3 LinearSVC線性支持向量分類算法 133
7.3 SVM的回歸實現方法及案例 135
7.3.1 SVR回歸實現方法 135
7.3.2 NuSVR回歸實現方法 137
7.3.3 LinearSVR回歸實現方法 138
7.4 SVM異常檢測的實現方法 139
7.5 SVM實戰——人臉識別 140
7.5.1 導入并顯示數據集 141
7.5.2 SVM分類器模型選擇和優化 142
本章小結 144
習 題 144
第8章 樸素貝葉斯方法 146
8.1 樸素貝葉斯方法概述 146
8.1.1 貝葉斯定理 146
8.1.2 樸素貝葉斯方法原理 147
8.2 不同分布下的貝葉斯方法 148
8.2.1 高斯樸素貝葉斯方法 148
8.2.2 多項式樸素貝葉斯方法 150
8.3 樸素貝葉斯實例——文本分類 152
8.4 概率類模型評估的評估指標 154
8.4.1 布利爾分數 155
8.4.2 對數損失函數 156
8.4.3 可靠性曲線 156
本章小結 158
習 題 159
第9章 聚類分析方法 161
9.1 聚類分析方法與無監督學習 161
9.1.1 聚類分析方法 161
9.1.2 聚類分析和分類分析的區別 162
9.2 k-均值聚類算法 162
9.2.1 k-均值聚類算法概述 162
9.2.2 距離度量 163
9.2.3 Sklearn中k-均值聚類算法的實現 164
9.2.4 k-均值聚類算法的優缺點 166
9.3 密度聚類算法 167
9.3.1 密度聚類算法概述 167
9.3.2 DBSCAN算法的實現 169
9.4 聚類算法的評估 170
9.4.1 確定聚類簇數k 170
9.4.2 評估聚類質量 172
9.5 聚類算法實例 174
本章小結 177
習 題 178
第10章 人工神經網絡與深度學習 179
10.1 人工神經網絡與深度學習概述 179
10.2 人工神經網絡的原理 181
10.2.1 人工神經元模型 181
10.2.2 人工神經網絡模型 185
10.2.3 人工神經網絡算法 186
10.3 BP神經網絡 186
10.3.1 BP神經網絡的模型 187
10.3.2 BP神經網絡的學習算法 187
10.3.3 BP神經網絡的設計 188
10.4 人工神經網絡的實現方法 189
10.4.1 MLPClassifier介紹 189
10.4.2 MLPClassifier案例 190
10.5 人工神經網絡算法實戰——人臉識別 195
10.5.1 導入數據集并進行數據集劃分 196
10.5.2 優化MLP分類器模型 196
10.5.3 MLP分類器模型預測 200
本章小結 201
練 習 201
第11章 數據可視化 202
11.1 數據可視化的概念及分類 202
11.2 使用Matplotlib庫進行圖表的繪制 204
11.2.1 圖表的主要元素及繪制步驟 204
11.2.2 簡單圖表繪制 206
11.2.3 多圖組合繪制 214
本章小結 216
習 題 217
第12章 基于Pyecharts的大數據可視化圖表 218
12.1 Pyecharts概述 218
12.1.1 Pyecharts的簡介 218
12.1.2 Pyecharts的主要繪制步驟 218
12.2 基于文本數據生成詞云圖 221
12.2.1 利用Pyecharts繪制英文詞云圖 221
12.2.2 利用jieba繪制中文詞云圖 222
12.3 基于結構化數據生成立體交互式圖表 223
12.4 基于JSON格式文件繪制桑基圖 225
12.5 繪制圓形關系圖 227
本章小結 229
習 題 229
參考文獻 230
- 輸水管線工程風險管理 [張勇 黨亥生 著]
- 民用航空飛機標準線路施工 [主編 王志敏 陳明]
- 不息的水脈—大運河講談錄 [趙珩 著]
- 實用運籌學 [主編 邢育紅 于晉臣]
- 三峽梯級電站水資源決策支持系統研究與開發 [姚華明 潘紅忠 湯正]
- 海南黎族民俗文化鑒賞 [龐國華 著]
- 石墨烯在太赫茲及中紅外頻段電磁器件設計中的應用 [李艷秀 莊華偉 著]
- 電子技術(第二版) [主編 覃愛娜 李飛]
- 辦公自動化高級應用 [陳萍 朱曉玉]
- 信息處理技術員考試32小時通關 [薛大龍]
- 電子產品設計案例教程(微課版)—基于嘉立創EDA(專業版) [王靜 莫志宏 陳學昌 丁紅]
- C程序設計實踐教程 [劉衛國]
- C程序設計(慕課版) [劉衛國]
- Web技術開發教程(基于.NET開源MVC框架) [王合闖 韓紅玲 王青正 陳海蕊]
- 商務英語翻譯教程(筆譯)(第四版) [主編 王軍平]
- 智慧零售技術與應用 [洪旭 著]
- 建設工程法規實務 [主編 余瀅]
- 商務秘書理論與實務(第三版) [主編 張同欽]
- 程序設計基礎實踐教程(C/C++語言版) [張桂芬 葛麗娜]
- C++案例項目精講 [主編 楊國興]
- 勞動爭議處理實務 [主編 王秀卿 羅靜]
- 工程數學 [主編 郭立娟 王海]
- 語音識別理論與實踐 [主編 莫宏偉]
- 信息系統項目管理師章節習題與考點特訓(第二版) [主編 薛大龍]
- 武術基礎教程 [主編 李代勇 謝志民]
- 計算機網絡實訓教程 [主編 張浩軍 趙玉娟]
- 畫法幾何與機械制圖習題集(多學時) [主編 趙軍]
- HCIA-Datacom認證題庫分類精講 [主 編 韓立剛]
- SwiftUI完全開發 [李智威 著]
- 網絡規劃設計師備考一本通 [夏杰 編著]