R語言基礎及應用

-
【作 者】主 編 涂旭東 黃源
【I S B N 】978-7-5170-9567-5
【責任編輯】石永峰
【適用讀者群】本專通用
【出版時間】2021-05-22
【開 本】16開
【裝幀信息】平裝(光膜)
【版 次】第1版第1次印刷
【頁 數】240
【千字數】374
【印 張】15
【定 價】¥45
【叢 書】普通高等教育數據科學與大數據技術專業教材
【備注信息】
簡介
本書特色
前言
章節列表
精彩閱讀
下載資源
相關圖書
本書以理論與實踐操作相結合的方式深入講解R語言的基本理論和實現方法,在內容設計上既有上課時老師講述的部分(包括詳細的理論與典型的案例),又有最新的實訓案例分析,雙管齊下,極大地激發了學生的學習積極性和主動創造性,增加了趣味性,讓學生在課堂上跟上老師的思維,從而學到更多的知識和技能。
本書的編寫目的是向讀者介紹R語言的基本概念與應用。本書共9章:R語言簡介、數據類型與數據對象、控制語句與函數、數據的讀寫與預處理、R語言基本圖形、ggplot2繪圖基礎和R語言高級繪圖、R語言數據分析基礎、R語言機器學習基礎、R語言訪問SQL數據庫。
本書可作為大數據專業、人工智能專業、云計算專業的教材,也可作為大數據愛好者的參考書。
內容實用——理論與實踐結合,重點突出應用
體系完善——構建完整的大數據專業解決方案
產教融合——高校企業共參與,對標行業標準
資源豐富——微課、課件、教案、源碼、答案
大數據作為新一輪工業革命中最為活躍的技術創新要素正在對全球競爭、國家治理、經濟發展、產業轉型、社會生活等產生全面而深刻的影響;移動互聯網、物聯網、社交網絡、數字家庭、電子商務等新一代信息技術的應用每天都在源源不斷地產生大量的數據,對大數據的處理分析正成為新一代信息技術融合應用的結合點。而靈活性、開放性、優秀的統計分析能力和卓越的繪圖功能、收錄超過1.4萬個數據分析工具包、幾乎涵蓋各個行業數據分析中的所有方法使R語言成為大數據時代的新寵,越來越被學界和業界所重視,多種大數據架構平臺上已經提供基于R語言的擴展和插件。借助R語言的高效性,大數據分析可實現事半功倍。
本書以理論與實踐操作相結合的方式深入講解R語言的基本理論和實現方法,在內容設計上既有上課時老師講述的部分(包括詳細的理論與典型的案例),又有最新的實訓案例分析,雙管齊下,極大地激發了學生的學習積極性和主動創造性,增加了趣味性,讓學生在課堂上跟上老師的思維,從而學到更多的知識和技能。
本書特色如下:
(1)采用“理實一體化”教學方式:課堂上既有老師的講述內容又有學生獨立思考、上機操作的內容。
(2)豐富的教學案例:包含教學課件、習題答案等多種教學資源。
(3)緊跟時代潮流,關注最新技術和前沿熱點,書中既包含最新熱點數據的案例分析,又包含唯美的數據可視化技術。
(4)編寫本書的老師都具有多年教學經驗,做到重難點突出,能夠激發學生的學習熱情。
(5)配有微課視頻:對本書中的重難點進行細致講解,方便學生課后學習。
本書可作為大數據專業、人工智能專業、云計算專業的教材,也可作為大數據愛好者的參考書。
本書建議學時為60學時,具體分布見下表。
章節 建議學時
R語言簡介 2
數據類型與數據對象 6
控制語句與函數 8
數據的讀寫與預處理 12
R語言基本圖形 6
ggplot2繪圖基礎和R語言高級繪圖 8
R語言數據分析基礎 8
R語言機器學習基礎 6
R語言訪問SQL數據庫 4
本書由涂旭東、黃源任主編。其中,黃源編寫第1章、第2章和第8章并負責策劃與統稿工作,涂旭東編寫第3章至第7章和第9章。
本書是校企合作的結果,在編寫過程中得到重慶譽存大數據有限公司黃遠江博士的大力支持,同時編者參閱了大量相關資料,在此一并表示感謝。
由于編者水平有限,書中難免存在疏漏甚至錯誤之處,懇請讀者批評指正,編者電子郵箱:2103069667@qq.com。
編 者
2021年2月
1.1 R語言概述 2
1.1.1 什么是R語言 2
1.1.2 R語言的特點 2
1.2 R的下載與運行 2
1.2.1 R的下載 3
1.2.2 R的運行 4
1.2.3 在R中查看幫助 6
1.3 R語言包 8
1.3.1 R語言包的安裝 9
1.3.2 R語言包的載入 9
1.3.3 R語言包的使用 9
1.4 實訓 10
1.5 本章小結 11
練習1 11
第2章 數據類型與數據對象 12
2.1 數據類型 13
2.1.1 什么是數據類型 13
2.1.2 常見的數據類型 13
2.2 變量與標量 14
2.2.1 變量 14
2.2.2 標量 15
2.3 R語言中的數據對象 16
2.3.1 向量 16
2.3.2 矩陣 20
2.3.3 數組 23
2.3.4 列表 24
2.3.5 因子 26
2.3.6 數據框 26
2.4 R語言中數據類型的轉換 31
2.4.1 類型轉換函數介紹 31
2.4.2 R中數據類型轉換實例 32
2.5 實訓 32
2.6 本章小結 33
練習2 34
第3章 控制語句與函數 35
3.1 條件結構 36
3.1.1 條件表達式 36
3.1.2 if語句 36
3.1.3 switch語句 38
3.2 循環結構 39
3.2.1 for循環 39
3.2.2 while循環 40
3.2.3 break語句 40
3.2.4 repeat語句 40
3.3 函數 41
3.3.1 自定義R函數 41
3.3.2 返回值 42
3.3.3 函數的參數 42
3.3.4 程序的向量化實現 43
3.3.5 apply()函數族 44
3.3.6 養成良好的代碼編寫習慣 49
3.4 實訓 49
3.5 本章小結 51
練習3 51
第4章 數據的讀寫與預處理 53
4.1 數據的輸入 54
4.1.1 工作目錄 54
4.1.2 向量的輸入 54
4.1.3 數據文件的讀取 55
4.1.4 讀取數據文件的注意事項 57
4.2 數據的輸出 58
4.2.1 屏幕輸出 58
4.2.2 向量的輸出 58
4.2.3 數據文件的輸出 59
4.3 R工作空間的保存和加載 61
4.3.1 R工作空間的保存 61
4.3.2 R工作空間的加載 61
4.4 變量的預處理 62
4.4.1 變量重編碼 62
4.4.2 變量重命名 63
4.4.3 變量的排序 63
4.4.4 變量類型的轉換 64
4.5 字符串的處理 65
4.5.1 字符串分割 65
4.5.2 字符串拼接 66
4.5.3 字符串長度計算 67
4.5.4 字符串截取 68
4.5.5 字符串替換 69
4.5.6 字符串大小寫轉換 70
4.5.7 字符串匹配 71
4.5.8 字符串格式化輸出 72
4.5.9 使用stringr包處理字符串 73
4.6 日期變量的處理和轉換 75
4.6.1 取系統日期和時間 75
4.6.2 把字符串解析成日期和時間 76
4.6.3 把日期和時間解析成字符串 76
4.6.4 對日期中相關信息的提取與比較 77
4.6.5 使用lubridate包處理日期變量 77
4.7 清洗重復數據 80
4.7.1 查找是否有重復值 80
4.7.2 查找重復值的索引值 80
4.7.3 去除重復值 81
4.8 缺失數據處理 81
4.8.1 缺失數據的識別 81
4.8.2 缺失數據的處理 82
4.9 異常值識別和處理 83
4.9.1 簡單統計量分析 83
4.9.2 根據3σ原則檢測異常值 84
4.9.3 根據箱型圖檢測異常值 84
4.9.4 蓋帽法 85
4.10 數據集的合并與拆分 86
4.10.1 數據集的合并 86
4.10.2 數據集的拆分 89
4.10.3 數據集的抽取 89
4.10.4 使用tidyr包 92
4.11 實訓 94
4.12 本章小結 99
練習4 99
第5章 R語言基本圖形 100
5.1 R語言常見圖形 101
5.1.1 散點圖 101
5.1.2 點圖 102
5.1.3 折線圖 102
5.1.4 曲線圖 103
5.1.5 條形圖 104
5.1.6 餅圖 105
5.1.7 箱線圖 107
5.1.8 直方圖 109
5.2 R語言圖形修飾 109
5.2.1 設置符號和線條 110
5.2.2 設置顏色 111
5.2.3 設置文本屬性 111
5.2.4 添加標題 112
5.2.5 添加圖例 113
5.2.6 添加線 113
5.2.7 添加坐標軸 115
5.2.8 添加文本標注 115
5.3 圖形的布局和保存 116
5.3.1 一頁多圖 116
5.3.2 保存圖形 117
5.4 實訓 117
5.5 本章小結 123
練習5 123
第6章 ggplot2繪圖基礎和R語言高級繪圖 125
6.1 ggplot2繪圖基礎 126
6.1.1 數據(Data) 126
6.1.2 映射(Mapping) 127
6.1.3 幾何對象(Geometric) 128
6.1.4 標尺(Scale) 131
6.1.5 統計變換(Statistics) 132
6.1.6 坐標系統(Coordinate) 133
6.1.7 圖層(Layer) 134
6.1.8 分面(Facet) 135
6.1.9 主題(Theme) 135
6.1.10 ggplot2繪圖的一般步驟 136
6.2 R語言高級繪圖 136
6.2.1 散點圖矩陣 136
6.2.2 關系矩陣圖和相關系數矩陣 137
6.2.3 橢圓 138
6.2.4 三維散點圖 139
6.2.5 氣泡圖 139
6.2.6 網絡圖 140
6.2.7 馬賽克圖 141
6.2.8 關鍵字云 142
6.2.9 雷達圖 143
6.2.10 山巒圖 144
6.2.11 交互圖 146
6.3 實訓 146
6.4 本章小結 155
練習6 155
第7章 R語言數據分析基礎 156
7.1 描述性統計分析 157
7.1.1 常用統計量簡介 157
7.1.2 描述性統計的函數實現 159
7.2 R語言數據分析常用函數 161
7.3 t-檢驗 164
7.3.1 單樣本t-檢驗 164
7.3.2 配對樣本t-檢驗 165
7.4 相關分析 166
7.4.1 相關性概念 166
7.4.2 相關分析 167
7.5 聚類分析 169
7.5.1 聚類分析的概念 169
7.5.2 計算樣本間的距離 169
7.5.3 計算類與類之間的距離 171
7.5.4 相似系數 171
7.5.5 聚類分析的主要步驟 172
7.5.6 分層聚類 172
7.5.7 k-means聚類 173
7.5.8 聚類分析的實現 174
7.6 主成分分析 175
7.6.1 主成分分析的基本思想 175
7.6.2 主成分分析的幾何解釋 176
7.6.3 主成分分析的數學模型 177
7.6.4 主成分分析的實現 177
7.7 實訓 179
7.8 本章小結 182
練習7 183
第8章 R語言機器學習基礎 184
8.1 機器學習概述 185
8.1.1 認識機器學習 185
8.1.2 機器學習的應用 185
8.2 機器學習分類 186
8.2.1 監督學習 186
8.2.2 無監督學習 187
8.2.3 半監督學習 188
8.3 機器學習常用算法 189
8.3.1 線性回歸 189
8.3.2 邏輯回歸 196
8.3.3 聚類 201
8.3.4 神經網絡 204
8.4 機器學習基本流程 206
8.4.1 數據的收集 206
8.4.2 數據預處理與特征工程 208
8.4.3 模型的選擇與訓練 209
8.4.4 模型的評估 209
8.5 實訓 210
8.6 本章小結 214
練習8 214
第9章 R語言訪問SQL數據庫 215
9.1 R語言訪問數據庫的基本原理 216
9.2 R語言訪問SQLite數據庫 216
9.3 R語言訪問MySQL數據庫 219
9.4 R語言訪問Oracle數據庫 222
9.5 ODBC和RODBC包介紹 224
9.6 實訓 227
9.7 本章小結 229
練習9 230
參考文獻 231
- 輸水管線工程風險管理 [張勇 黨亥生 著]
- 民用航空飛機標準線路施工 [主編 王志敏 陳明]
- 不息的水脈—大運河講談錄 [趙珩 著]
- 實用運籌學 [主編 邢育紅 于晉臣]
- 三峽梯級電站水資源決策支持系統研究與開發 [姚華明 潘紅忠 湯正]
- 海南黎族民俗文化鑒賞 [龐國華 著]
- 石墨烯在太赫茲及中紅外頻段電磁器件設計中的應用 [李艷秀 莊華偉 著]
- 電子技術(第二版) [主編 覃愛娜 李飛]
- 辦公自動化高級應用 [陳萍 朱曉玉]
- 信息處理技術員考試32小時通關 [薛大龍]
- 電子產品設計案例教程(微課版)—基于嘉立創EDA(專業版) [王靜 莫志宏 陳學昌 丁紅]
- C程序設計實踐教程 [劉衛國]
- C程序設計(慕課版) [劉衛國]
- Web技術開發教程(基于.NET開源MVC框架) [王合闖 韓紅玲 王青正 陳海蕊]
- 商務英語翻譯教程(筆譯)(第四版) [主編 王軍平]
- 智慧零售技術與應用 [洪旭 著]
- 建設工程法規實務 [主編 余瀅]
- 商務秘書理論與實務(第三版) [主編 張同欽]
- 程序設計基礎實踐教程(C/C++語言版) [張桂芬 葛麗娜]
- C++案例項目精講 [主編 楊國興]
- 勞動爭議處理實務 [主編 王秀卿 羅靜]
- 工程數學 [主編 郭立娟 王海]
- 語音識別理論與實踐 [主編 莫宏偉]
- 信息系統項目管理師章節習題與考點特訓(第二版) [主編 薛大龍]
- 武術基礎教程 [主編 李代勇 謝志民]
- 計算機網絡實訓教程 [主編 張浩軍 趙玉娟]
- 畫法幾何與機械制圖習題集(多學時) [主編 趙軍]
- HCIA-Datacom認證題庫分類精講 [主 編 韓立剛]
- SwiftUI完全開發 [李智威 著]
- 網絡規劃設計師備考一本通 [夏杰 編著]