Python數據分析
-
【作 者】主編 馮志輝 趙磊 李放
【I S B N 】978-7-5226-2166-1
【責任編輯】魏淵源
【適用讀者群】本專通用
【出版時間】2024-03-05
【開 本】16開
【裝幀信息】平裝(光膜)
【版 次】第1版第1次印刷
【頁 數】208
【千字數】333
【印 張】13
【定 價】¥42
【叢 書】普通高等教育數據科學與大數據技術專業教材
【備注信息】
簡介
本書特色
前言
章節列表
精彩閱讀
下載資源
相關圖書
本書從開發環境配置入手,以先理論后實踐的形式講解Python數據分析,理論部分內容包括Python簡介及數據分析概述、Python語言基礎、科學計算庫NumPy、數據處理庫Pandas、數據可視化和數據分析方法,由淺入深地引出實踐部分的三個經典數據分析實戰案例,并將理論知識綜合應用到數據分析案例中,進一步加深知識理解。全書理論部分可以作為理論課知識進行教學,案例內容可以用于實訓課教學。全書章節可以拆分重組,為不同背景知識的學生提供合適的知識組合,為教師組織教學提供便利。本書內容表達圖文并茂、通俗易懂,以實踐操作應用為導向,側重知識的內在認知邏輯引導,適合于理論與實踐相結合的教學方式。
本書適合作為本科或高職院校的計算機科學技術、數據科學與大數據技術、人工智能、信息管理、電子商務、應用數學、信息與計算科學、統計學、金融工程、市場營銷等專業的教學用書,同時也適合作為其他相關專業的選修課程教材。本書提供微課視頻,并配套程序源代碼、教學課件和習題答案。
內容實用——理論與實踐結合,重點突出應用
體系完善——構建完整的大數據專業解決方案
產教融合——高校企業共參與,對標行業標準
資源豐富——微課、課件、教案、源碼、答案
“Python數據分析”是信息管理、計算機科學技術等專業的大數據方向及人工智能方向的專業核心課程之一,課程設置學期位于職業能力形成階段,主要講解大數據分析基礎理論、分析工具、分析方法
等。課程目標是使學生能夠熟練運用Python工具來解決實際問題,同時讓學生掌握在不同領域使用Python擴展模塊解決大數據處理問題的方法,要求學生通過課堂教學和實驗訓練后,具有初步處理數據、獨立分析數據的能力。數據分析作為一種從數據中提煉信息的方法,在就業方面也是多個崗位要求掌握的技能。
本書致力于推動數據分析的普及教育,深入淺出地介紹了數據分析相關知識,使用通俗易懂的語言進行講述,內容包括Python語言的語法特點以及數據分析的流程思路,并結合典型應用展開闡述,從基本知識和數據分析的邏輯關系角度,使讀者建立起數據分析的知識體系和框架。本書不局限于知識和技能的介紹,更注重從數理思維的角度引發讀者探索數據世界的興趣,激發求知欲,使其通過理論學習和實踐過程的反復迭代,在認識客觀世界的方法上有更加深刻的認識,這也是辯證唯物主義實踐觀和認識觀的一種學習體驗。
本書共9章,前6章為理論部分,包括Python簡介及數據分析概述、Python語言基礎、科學計算庫NumPy、數據處理庫Pandas、數據可視化、數據分析方法;后面3章結合數據分析的典型案例,進行數據分析實戰演練。
本書的編寫注重可讀性和邏輯性,并在章節中增加了課程思政的案例和內容,將知識傳授、能力培養和價值塑造有機融合。本書由馮志輝、趙磊、李放擔任主編,魚明、陳慧穎、陳祥擔任副主編。本書的Pandas講解及案例編程部分得到了東北師范大學趙志銘的支持和幫助,另外在本書編寫過程中,智慧云未來科技(北京)有限公司黃智慧總經理和北京普開數據技術有限公司劉生副總經理給予了技術指導,中國水利水電出版社的領導和編輯也給予了很大的支持與幫助,并付出了辛勤勞動,在此一并向他們表示衷心感謝。
由于編者水平有限,加之時間倉促,書中難免存在錯誤和不妥之處,懇請讀者批評指正。
編 者
2023年9月
第1章 Python簡介及數據分析概述 1
1.1 Python簡介 1
1.1.1 Python語言的特點 1
1.1.2 Python語言的應用領域 2
1.2 Python開發環境部署 3
1.2.1 下載對應版本安裝文件 4
1.2.2 Python的安裝及相關文件介紹 6
1.3 擴展庫的安裝 9
1.4 開發環境應用示例 12
1.4.1 Anaconda的功能介紹及安裝 12
1.4.2 JupyterLab的使用及文本數據分析
實例演示 14
1.5 數據分析概述 18
1.5.1 數據分析的過程 18
1.5.2 數據分析常用擴展庫 19
本章小結 20
練習1 20
第2章 Python語言基礎 22
2.1 數據類型 22
2.1.1 數值 22
2.1.2 字符串 24
2.1.3 列表 25
2.1.4 元組 25
2.1.5 集合 26
2.1.6 字典 26
2.2 數據類型的共有方法 27
2.2.1 索引 27
2.2.2 切片 28
2.2.3 提取長度 28
2.2.4 統計 28
2.2.5 確認成員身份 29
2.2.6 刪除變量 29
2.3 字符串、列表、元組、集合及字典的方法 30
2.3.1 字符串的方法 30
2.3.2 列表的方法 33
2.3.3 元組的方法 35
2.3.4 集合的方法 36
2.3.5 字典的方法 38
2.4 內置函數、內置模塊與自定義函數 40
2.4.1 內置函數 40
2.4.2 高級函數 41
2.4.3 help()函數 43
2.4.4 內置函數與內置模塊的區別 44
2.4.5 常用的內置模塊 44
2.4.6 自定義函數 44
2.5 類和對象 47
2.5.1 類和對象的概念 47
2.5.2 類和對象的使用 47
2.5.3 類和對象實例演示 48
2.6 讀取數據文件 50
本章小結 51
練習2 51
第3章 科學計算庫NumPy 54
3.1 NumPy簡介 54
3.2 NumPy中的對象 55
3.2.1 ndarray對象 56
3.2.2 array對象的屬性和方法 58
3.2.3 NumPy創建數組 58
3.3 NumPy中數組的索引 62
3.3.1 數組的維度和基本索引 62
3.3.2 高級索引 63
3.4 Numpy中的統計函數 64
3.5 Numpy中的矩陣操作 66
本章小結 67
練習3 68
第4章 數據處理庫Pandas 70
4.1 Pandas簡介 70
4.1.1 Pandas的安裝與導入 70
4.1.2 數據類型Series 71
4.1.3 數據類型DataFrame 71
4.2 數據文件讀取 72
4.2.1 excel文件讀取 72
4.2.2 csv文件讀取 73
4.3 數據類型Series和DataFrame 73
4.3.1 Series常見的屬性與方法 73
4.3.2 DataFrame常見的屬性與方法 84
4.4 Pandas的高級操作 95
4.4.1 Pandas的高級操作簡介 95
4.4.2 Pandas數據分析案例1 97
4.4.3 Pandas數據分析案例2 99
本章小結 107
練習4 107
第5章 數據可視化 109
5.1 數據可視化簡介 109
5.2 Matplotlib可視化 110
5.2.1 Matplotlib散點圖示例 111
5.2.2 Matplotlib線圖示例 112
5.2.3 Matplotlib柱狀圖示例 113
5.2.4 Matplotlib餅圖示例 114
5.2.5 Matplotlib箱線圖示例 115
5.2.6 Matplotlib直方圖示例 116
5.2.7 Matplotlib多子圖示例 117
5.3 Pandas繪圖 120
本章小結 125
練習5 125
第6章 數據分析方法 127
6.1 數據分析方法概述 127
6.1.1 ETL(Extract-Transform-Load) 127
6.1.2 數據分析中常用的方法 128
6.2 數據預處理 128
6.2.1 異常值處理 128
6.2.2 缺失值處理 129
6.2.3 歸一化處理 129
6.3 分類與預測 130
6.3.1 決策樹 130
6.3.2 樸素貝葉斯 134
6.3.3 支持向量機 136
6.3.4 神經網絡 139
6.4 回歸 142
6.4.1 線性回歸 142
6.4.2 非線性回歸 143
6.5 聚類 144
6.5.1 層次聚類 144
6.5.2 非層次聚類 146
本章小結 147
練習6 147
第7章 電影數據分析 150
7.1 項目簡介 150
7.2 代碼實現 150
7.2.1 數據清洗 150
7.2.2 編程打分 153
7.2.3 其他數據類型處理 157
7.2.4 建模分析 162
本章小結 165
練習7 165
第8章 客戶價值分析 166
8.1 項目簡介 166
8.2 代碼實現 167
8.2.1 數據清洗 167
8.2.2 客戶屬性與客戶流失的關系分析 171
8.2.3 產品屬性與客戶流失的關系分析 175
8.2.4 客戶行為與客戶流失的關系分析 179
本章小結 187
練習8 187
第9章 房價預測分析 188
9.1 項目簡介 188
9.2 代碼實現 189
9.2.1 線性回歸 194
9.2.2 隨機森林 197
9.2.3 支持向量機 199
9.2.4 模型評估比較 201
本章小結 201
練習9 201
參考文獻 202
- Python程序設計及實踐教程 [肖朝暉]
- C語言程序設計 [魏琴 劉祖珉 趙仕波 肖陽春]
- C語言程序設計實驗教程 [張小剛 司春景]
- 電氣控制與PLC程序設計(第二版) [胡冠山]
- Java Web項目化設計實踐教程 [邱云 曾陳萍]
- 人工智能開發框架應用 [主編 王明超 蘆婭云]
- C語言程序設計(第三版) [主編 丁紅 王立新 蔡開立]
- 民航客艙服務實用英語教程 [主編 田靜 徐亞玲]
- 大學信息技術 [曾翰穎 編著]
- Python程序設計與應用(第二版) [主編 張廣淵]
- 多維視域下的高校籃球教學創新研究 [張利超 李寧 著]
- 創新創業訓練實踐教程 [主編 王日華 陳武 黃喆誠]
- 實用運籌學 [主編 邢育紅 于晉臣]
- 電子技術(第二版) [主編 覃愛娜 李飛]
- C程序設計實踐教程 [劉衛國]
- C程序設計(慕課版) [劉衛國]
- 程序設計基礎實踐教程(C/C++語言版) [張桂芬 葛麗娜]
- C++案例項目精講 [主編 楊國興]
- 勞動爭議處理實務 [主編 王秀卿 羅靜]
- 工程數學 [主編 郭立娟 王海]
- 語音識別理論與實踐 [主編 莫宏偉]
- 武術基礎教程 [主編 李代勇 謝志民]
- 計算機網絡實訓教程 [主編 張浩軍 趙玉娟]
- 畫法幾何與機械制圖習題集(多學時) [主編 趙軍]
- SwiftUI完全開發 [李智威 著]
- 電工電子技術基礎 [主編 劉 軍 楊國龍 劉天成]
- MySQL數據庫項目式教程 [陳亞峰]
- 機械設計基礎(第二版) [主編 田亞平 李愛姣]
- 畫法幾何與機械制圖 [主編 趙軍]
- C語言程序設計習題與實驗指導(第二版) [主編 甄增榮 張賓]