R語言基礎及應用

-
【作 者】主 編 涂旭東 黃源
【I S B N 】978-7-5170-9567-5
【責任編輯】石永峰
【適用讀者群】本專通用
【出版時間】2021-05-22
【開 本】16開
【裝幀信息】平裝(光膜)
【版 次】第1版第1次印刷
【頁 數】240
【千字數】374
【印 張】15
【定 價】¥45
【叢 書】普通高等教育數據科學與大數據技術專業教材
【備注信息】
簡介
本書特色
前言
章節列表
精彩閱讀
下載資源
相關圖書
本書以理論與實踐操作相結合的方式深入講解R語言的基本理論和實現方法,在內容設計上既有上課時老師講述的部分(包括詳細的理論與典型的案例),又有最新的實訓案例分析,雙管齊下,極大地激發了學生的學習積極性和主動創造性,增加了趣味性,讓學生在課堂上跟上老師的思維,從而學到更多的知識和技能。
本書的編寫目的是向讀者介紹R語言的基本概念與應用。本書共9章:R語言簡介、數據類型與數據對象、控制語句與函數、數據的讀寫與預處理、R語言基本圖形、ggplot2繪圖基礎和R語言高級繪圖、R語言數據分析基礎、R語言機器學習基礎、R語言訪問SQL數據庫。
本書可作為大數據專業、人工智能專業、云計算專業的教材,也可作為大數據愛好者的參考書。
內容實用——理論與實踐結合,重點突出應用
體系完善——構建完整的大數據專業解決方案
產教融合——高校企業共參與,對標行業標準
資源豐富——微課、課件、教案、源碼、答案
大數據作為新一輪工業革命中最為活躍的技術創新要素正在對全球競爭、國家治理、經濟發展、產業轉型、社會生活等產生全面而深刻的影響;移動互聯網、物聯網、社交網絡、數字家庭、電子商務等新一代信息技術的應用每天都在源源不斷地產生大量的數據,對大數據的處理分析正成為新一代信息技術融合應用的結合點。而靈活性、開放性、優秀的統計分析能力和卓越的繪圖功能、收錄超過1.4萬個數據分析工具包、幾乎涵蓋各個行業數據分析中的所有方法使R語言成為大數據時代的新寵,越來越被學界和業界所重視,多種大數據架構平臺上已經提供基于R語言的擴展和插件。借助R語言的高效性,大數據分析可實現事半功倍。
本書以理論與實踐操作相結合的方式深入講解R語言的基本理論和實現方法,在內容設計上既有上課時老師講述的部分(包括詳細的理論與典型的案例),又有最新的實訓案例分析,雙管齊下,極大地激發了學生的學習積極性和主動創造性,增加了趣味性,讓學生在課堂上跟上老師的思維,從而學到更多的知識和技能。
本書特色如下:
(1)采用“理實一體化”教學方式:課堂上既有老師的講述內容又有學生獨立思考、上機操作的內容。
(2)豐富的教學案例:包含教學課件、習題答案等多種教學資源。
(3)緊跟時代潮流,關注最新技術和前沿熱點,書中既包含最新熱點數據的案例分析,又包含唯美的數據可視化技術。
(4)編寫本書的老師都具有多年教學經驗,做到重難點突出,能夠激發學生的學習熱情。
(5)配有微課視頻:對本書中的重難點進行細致講解,方便學生課后學習。
本書可作為大數據專業、人工智能專業、云計算專業的教材,也可作為大數據愛好者的參考書。
本書建議學時為60學時,具體分布見下表。
章節 建議學時
R語言簡介 2
數據類型與數據對象 6
控制語句與函數 8
數據的讀寫與預處理 12
R語言基本圖形 6
ggplot2繪圖基礎和R語言高級繪圖 8
R語言數據分析基礎 8
R語言機器學習基礎 6
R語言訪問SQL數據庫 4
本書由涂旭東、黃源任主編。其中,黃源編寫第1章、第2章和第8章并負責策劃與統稿工作,涂旭東編寫第3章至第7章和第9章。
本書是校企合作的結果,在編寫過程中得到重慶譽存大數據有限公司黃遠江博士的大力支持,同時編者參閱了大量相關資料,在此一并表示感謝。
由于編者水平有限,書中難免存在疏漏甚至錯誤之處,懇請讀者批評指正,編者電子郵箱:2103069667@qq.com。
編 者
2021年2月
1.1 R語言概述 2
1.1.1 什么是R語言 2
1.1.2 R語言的特點 2
1.2 R的下載與運行 2
1.2.1 R的下載 3
1.2.2 R的運行 4
1.2.3 在R中查看幫助 6
1.3 R語言包 8
1.3.1 R語言包的安裝 9
1.3.2 R語言包的載入 9
1.3.3 R語言包的使用 9
1.4 實訓 10
1.5 本章小結 11
練習1 11
第2章 數據類型與數據對象 12
2.1 數據類型 13
2.1.1 什么是數據類型 13
2.1.2 常見的數據類型 13
2.2 變量與標量 14
2.2.1 變量 14
2.2.2 標量 15
2.3 R語言中的數據對象 16
2.3.1 向量 16
2.3.2 矩陣 20
2.3.3 數組 23
2.3.4 列表 24
2.3.5 因子 26
2.3.6 數據框 26
2.4 R語言中數據類型的轉換 31
2.4.1 類型轉換函數介紹 31
2.4.2 R中數據類型轉換實例 32
2.5 實訓 32
2.6 本章小結 33
練習2 34
第3章 控制語句與函數 35
3.1 條件結構 36
3.1.1 條件表達式 36
3.1.2 if語句 36
3.1.3 switch語句 38
3.2 循環結構 39
3.2.1 for循環 39
3.2.2 while循環 40
3.2.3 break語句 40
3.2.4 repeat語句 40
3.3 函數 41
3.3.1 自定義R函數 41
3.3.2 返回值 42
3.3.3 函數的參數 42
3.3.4 程序的向量化實現 43
3.3.5 apply()函數族 44
3.3.6 養成良好的代碼編寫習慣 49
3.4 實訓 49
3.5 本章小結 51
練習3 51
第4章 數據的讀寫與預處理 53
4.1 數據的輸入 54
4.1.1 工作目錄 54
4.1.2 向量的輸入 54
4.1.3 數據文件的讀取 55
4.1.4 讀取數據文件的注意事項 57
4.2 數據的輸出 58
4.2.1 屏幕輸出 58
4.2.2 向量的輸出 58
4.2.3 數據文件的輸出 59
4.3 R工作空間的保存和加載 61
4.3.1 R工作空間的保存 61
4.3.2 R工作空間的加載 61
4.4 變量的預處理 62
4.4.1 變量重編碼 62
4.4.2 變量重命名 63
4.4.3 變量的排序 63
4.4.4 變量類型的轉換 64
4.5 字符串的處理 65
4.5.1 字符串分割 65
4.5.2 字符串拼接 66
4.5.3 字符串長度計算 67
4.5.4 字符串截取 68
4.5.5 字符串替換 69
4.5.6 字符串大小寫轉換 70
4.5.7 字符串匹配 71
4.5.8 字符串格式化輸出 72
4.5.9 使用stringr包處理字符串 73
4.6 日期變量的處理和轉換 75
4.6.1 取系統日期和時間 75
4.6.2 把字符串解析成日期和時間 76
4.6.3 把日期和時間解析成字符串 76
4.6.4 對日期中相關信息的提取與比較 77
4.6.5 使用lubridate包處理日期變量 77
4.7 清洗重復數據 80
4.7.1 查找是否有重復值 80
4.7.2 查找重復值的索引值 80
4.7.3 去除重復值 81
4.8 缺失數據處理 81
4.8.1 缺失數據的識別 81
4.8.2 缺失數據的處理 82
4.9 異常值識別和處理 83
4.9.1 簡單統計量分析 83
4.9.2 根據3σ原則檢測異常值 84
4.9.3 根據箱型圖檢測異常值 84
4.9.4 蓋帽法 85
4.10 數據集的合并與拆分 86
4.10.1 數據集的合并 86
4.10.2 數據集的拆分 89
4.10.3 數據集的抽取 89
4.10.4 使用tidyr包 92
4.11 實訓 94
4.12 本章小結 99
練習4 99
第5章 R語言基本圖形 100
5.1 R語言常見圖形 101
5.1.1 散點圖 101
5.1.2 點圖 102
5.1.3 折線圖 102
5.1.4 曲線圖 103
5.1.5 條形圖 104
5.1.6 餅圖 105
5.1.7 箱線圖 107
5.1.8 直方圖 109
5.2 R語言圖形修飾 109
5.2.1 設置符號和線條 110
5.2.2 設置顏色 111
5.2.3 設置文本屬性 111
5.2.4 添加標題 112
5.2.5 添加圖例 113
5.2.6 添加線 113
5.2.7 添加坐標軸 115
5.2.8 添加文本標注 115
5.3 圖形的布局和保存 116
5.3.1 一頁多圖 116
5.3.2 保存圖形 117
5.4 實訓 117
5.5 本章小結 123
練習5 123
第6章 ggplot2繪圖基礎和R語言高級繪圖 125
6.1 ggplot2繪圖基礎 126
6.1.1 數據(Data) 126
6.1.2 映射(Mapping) 127
6.1.3 幾何對象(Geometric) 128
6.1.4 標尺(Scale) 131
6.1.5 統計變換(Statistics) 132
6.1.6 坐標系統(Coordinate) 133
6.1.7 圖層(Layer) 134
6.1.8 分面(Facet) 135
6.1.9 主題(Theme) 135
6.1.10 ggplot2繪圖的一般步驟 136
6.2 R語言高級繪圖 136
6.2.1 散點圖矩陣 136
6.2.2 關系矩陣圖和相關系數矩陣 137
6.2.3 橢圓 138
6.2.4 三維散點圖 139
6.2.5 氣泡圖 139
6.2.6 網絡圖 140
6.2.7 馬賽克圖 141
6.2.8 關鍵字云 142
6.2.9 雷達圖 143
6.2.10 山巒圖 144
6.2.11 交互圖 146
6.3 實訓 146
6.4 本章小結 155
練習6 155
第7章 R語言數據分析基礎 156
7.1 描述性統計分析 157
7.1.1 常用統計量簡介 157
7.1.2 描述性統計的函數實現 159
7.2 R語言數據分析常用函數 161
7.3 t-檢驗 164
7.3.1 單樣本t-檢驗 164
7.3.2 配對樣本t-檢驗 165
7.4 相關分析 166
7.4.1 相關性概念 166
7.4.2 相關分析 167
7.5 聚類分析 169
7.5.1 聚類分析的概念 169
7.5.2 計算樣本間的距離 169
7.5.3 計算類與類之間的距離 171
7.5.4 相似系數 171
7.5.5 聚類分析的主要步驟 172
7.5.6 分層聚類 172
7.5.7 k-means聚類 173
7.5.8 聚類分析的實現 174
7.6 主成分分析 175
7.6.1 主成分分析的基本思想 175
7.6.2 主成分分析的幾何解釋 176
7.6.3 主成分分析的數學模型 177
7.6.4 主成分分析的實現 177
7.7 實訓 179
7.8 本章小結 182
練習7 183
第8章 R語言機器學習基礎 184
8.1 機器學習概述 185
8.1.1 認識機器學習 185
8.1.2 機器學習的應用 185
8.2 機器學習分類 186
8.2.1 監督學習 186
8.2.2 無監督學習 187
8.2.3 半監督學習 188
8.3 機器學習常用算法 189
8.3.1 線性回歸 189
8.3.2 邏輯回歸 196
8.3.3 聚類 201
8.3.4 神經網絡 204
8.4 機器學習基本流程 206
8.4.1 數據的收集 206
8.4.2 數據預處理與特征工程 208
8.4.3 模型的選擇與訓練 209
8.4.4 模型的評估 209
8.5 實訓 210
8.6 本章小結 214
練習8 214
第9章 R語言訪問SQL數據庫 215
9.1 R語言訪問數據庫的基本原理 216
9.2 R語言訪問SQLite數據庫 216
9.3 R語言訪問MySQL數據庫 219
9.4 R語言訪問Oracle數據庫 222
9.5 ODBC和RODBC包介紹 224
9.6 實訓 227
9.7 本章小結 229
練習9 230
參考文獻 231
- 庭院風骨—樹、灌、籬 [創意房主 著]
- Python語言程序設計教程 [郭其標 房宜汕]
- 微積分(經管類)教程篇(下冊) [曹海軍 王海棠 周玲麗]
- 微積分(經管類)教程篇(上冊) [曹海軍 王海棠 周玲麗]
- 微積分(經管類)導學篇(上冊) [王海棠 曹海軍 周玲麗]
- 網站前端技術案例教程(HTML+CSS+JavaScript)(第二版) [黃華升]
- 線性代數 [主編 史昱 陳鳳欣]
- 電力電子技術課程學習及實驗指導 [主編 陳榮]
- 成長對話:青春的榜樣 [主編 施端銀 黃武剛 應巨林]
- 人工智能應用基礎 [主編 楊纓 李佳]
- 中華水文化(慕課版)(第二版) [畢雪燕 楊華軻 羅玲誼 等編著]
- 電路與電子技術Ⅱ——電路分析基礎 [主編 陳曉 金哲]
- 飛機維修專業英語——飛機系統(第二版) [趙迎春]
- 英語大爆炸:跟趣味情景劇學口語(微課版) [秦然 編著]
- 機械工程制圖任務跟蹤訓練 [主編 王瑞清 趙金考 周彥云 ]
- 機械工程制圖 [主編 覃國萍 劉百順 禹晨]
- 平面設計與制作項目化教程 [主編 李晨]
- 后期影像剪輯技術 [主編 郭建偉]
- 人工智能概論(第二版) [主編 任云暉 丁紅 徐迎春 ]
- 信息時代美育之道 [主編 劉宏宇 黎婭]
- 數字媒體交互設計項目式教程(微課版) [主編 蘇陸]
- 動畫運動規律項目實例解析(微課版) [孫珊珊 袁維坤]
- 自然語言處理 [主編 馮建周]
- 新媒體內容創作實務(微課版) [主編 覃思源]
- 人工智能基礎 [主編 余平 張春陽]
- 人工智能導論 [主編 王飛 潘立武]
- Amazing!兒童英語自然拼讀分級教材(全8冊) [王玲 編著]
- Spark大數據處理技術 [主編 劉仁山 周洪翠 莊新妍]
- 毫無PS痕跡—你的第一本Photoshop書(第二版) [趙鵬 著]
- 電視新聞制作(活頁式) [主編 王曉翠 劉傳琳]