R語言基礎(chǔ)及應(yīng)用
-
【作 者】主 編 涂旭東 黃源
【I S B N 】978-7-5170-9567-5
【責(zé)任編輯】石永峰
【適用讀者群】本專通用
【出版時間】2021-05-22
【開 本】16開
【裝幀信息】平裝(光膜)
【版 次】第1版第1次印刷
【頁 數(shù)】240
【千字?jǐn)?shù)】374
【印 張】15
【定 價】¥45
【叢 書】普通高等教育數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)專業(yè)教材
【備注信息】
簡介
本書特色
前言
章節(jié)列表
精彩閱讀
下載資源
相關(guān)圖書
本書以理論與實踐操作相結(jié)合的方式深入講解R語言的基本理論和實現(xiàn)方法,在內(nèi)容設(shè)計上既有上課時老師講述的部分(包括詳細(xì)的理論與典型的案例),又有最新的實訓(xùn)案例分析,雙管齊下,極大地激發(fā)了學(xué)生的學(xué)習(xí)積極性和主動創(chuàng)造性,增加了趣味性,讓學(xué)生在課堂上跟上老師的思維,從而學(xué)到更多的知識和技能。
本書的編寫目的是向讀者介紹R語言的基本概念與應(yīng)用。本書共9章:R語言簡介、數(shù)據(jù)類型與數(shù)據(jù)對象、控制語句與函數(shù)、數(shù)據(jù)的讀寫與預(yù)處理、R語言基本圖形、ggplot2繪圖基礎(chǔ)和R語言高級繪圖、R語言數(shù)據(jù)分析基礎(chǔ)、R語言機器學(xué)習(xí)基礎(chǔ)、R語言訪問SQL數(shù)據(jù)庫。
本書可作為大數(shù)據(jù)專業(yè)、人工智能專業(yè)、云計算專業(yè)的教材,也可作為大數(shù)據(jù)愛好者的參考書。
內(nèi)容實用——理論與實踐結(jié)合,重點突出應(yīng)用
體系完善——構(gòu)建完整的大數(shù)據(jù)專業(yè)解決方案
產(chǎn)教融合——高校企業(yè)共參與,對標(biāo)行業(yè)標(biāo)準(zhǔn)
資源豐富——微課、課件、教案、源碼、答案
大數(shù)據(jù)作為新一輪工業(yè)革命中最為活躍的技術(shù)創(chuàng)新要素正在對全球競爭、國家治理、經(jīng)濟發(fā)展、產(chǎn)業(yè)轉(zhuǎn)型、社會生活等產(chǎn)生全面而深刻的影響;移動互聯(lián)網(wǎng)、物聯(lián)網(wǎng)、社交網(wǎng)絡(luò)、數(shù)字家庭、電子商務(wù)等新一代信息技術(shù)的應(yīng)用每天都在源源不斷地產(chǎn)生大量的數(shù)據(jù),對大數(shù)據(jù)的處理分析正成為新一代信息技術(shù)融合應(yīng)用的結(jié)合點。而靈活性、開放性、優(yōu)秀的統(tǒng)計分析能力和卓越的繪圖功能、收錄超過1.4萬個數(shù)據(jù)分析工具包、幾乎涵蓋各個行業(yè)數(shù)據(jù)分析中的所有方法使R語言成為大數(shù)據(jù)時代的新寵,越來越被學(xué)界和業(yè)界所重視,多種大數(shù)據(jù)架構(gòu)平臺上已經(jīng)提供基于R語言的擴展和插件。借助R語言的高效性,大數(shù)據(jù)分析可實現(xiàn)事半功倍。
本書以理論與實踐操作相結(jié)合的方式深入講解R語言的基本理論和實現(xiàn)方法,在內(nèi)容設(shè)計上既有上課時老師講述的部分(包括詳細(xì)的理論與典型的案例),又有最新的實訓(xùn)案例分析,雙管齊下,極大地激發(fā)了學(xué)生的學(xué)習(xí)積極性和主動創(chuàng)造性,增加了趣味性,讓學(xué)生在課堂上跟上老師的思維,從而學(xué)到更多的知識和技能。
本書特色如下:
(1)采用“理實一體化”教學(xué)方式:課堂上既有老師的講述內(nèi)容又有學(xué)生獨立思考、上機操作的內(nèi)容。
(2)豐富的教學(xué)案例:包含教學(xué)課件、習(xí)題答案等多種教學(xué)資源。
(3)緊跟時代潮流,關(guān)注最新技術(shù)和前沿?zé)狳c,書中既包含最新熱點數(shù)據(jù)的案例分析,又包含唯美的數(shù)據(jù)可視化技術(shù)。
(4)編寫本書的老師都具有多年教學(xué)經(jīng)驗,做到重難點突出,能夠激發(fā)學(xué)生的學(xué)習(xí)熱情。
(5)配有微課視頻:對本書中的重難點進行細(xì)致講解,方便學(xué)生課后學(xué)習(xí)。
本書可作為大數(shù)據(jù)專業(yè)、人工智能專業(yè)、云計算專業(yè)的教材,也可作為大數(shù)據(jù)愛好者的參考書。
本書建議學(xué)時為60學(xué)時,具體分布見下表。
章節(jié) 建議學(xué)時
R語言簡介 2
數(shù)據(jù)類型與數(shù)據(jù)對象 6
控制語句與函數(shù) 8
數(shù)據(jù)的讀寫與預(yù)處理 12
R語言基本圖形 6
ggplot2繪圖基礎(chǔ)和R語言高級繪圖 8
R語言數(shù)據(jù)分析基礎(chǔ) 8
R語言機器學(xué)習(xí)基礎(chǔ) 6
R語言訪問SQL數(shù)據(jù)庫 4
本書由涂旭東、黃源任主編。其中,黃源編寫第1章、第2章和第8章并負(fù)責(zé)策劃與統(tǒng)稿工作,涂旭東編寫第3章至第7章和第9章。
本書是校企合作的結(jié)果,在編寫過程中得到重慶譽存大數(shù)據(jù)有限公司黃遠江博士的大力支持,同時編者參閱了大量相關(guān)資料,在此一并表示感謝。
由于編者水平有限,書中難免存在疏漏甚至錯誤之處,懇請讀者批評指正,編者電子郵箱:2103069667@qq.com。
編 者
2021年2月
1.1 R語言概述 2
1.1.1 什么是R語言 2
1.1.2 R語言的特點 2
1.2 R的下載與運行 2
1.2.1 R的下載 3
1.2.2 R的運行 4
1.2.3 在R中查看幫助 6
1.3 R語言包 8
1.3.1 R語言包的安裝 9
1.3.2 R語言包的載入 9
1.3.3 R語言包的使用 9
1.4 實訓(xùn) 10
1.5 本章小結(jié) 11
練習(xí)1 11
第2章 數(shù)據(jù)類型與數(shù)據(jù)對象 12
2.1 數(shù)據(jù)類型 13
2.1.1 什么是數(shù)據(jù)類型 13
2.1.2 常見的數(shù)據(jù)類型 13
2.2 變量與標(biāo)量 14
2.2.1 變量 14
2.2.2 標(biāo)量 15
2.3 R語言中的數(shù)據(jù)對象 16
2.3.1 向量 16
2.3.2 矩陣 20
2.3.3 數(shù)組 23
2.3.4 列表 24
2.3.5 因子 26
2.3.6 數(shù)據(jù)框 26
2.4 R語言中數(shù)據(jù)類型的轉(zhuǎn)換 31
2.4.1 類型轉(zhuǎn)換函數(shù)介紹 31
2.4.2 R中數(shù)據(jù)類型轉(zhuǎn)換實例 32
2.5 實訓(xùn) 32
2.6 本章小結(jié) 33
練習(xí)2 34
第3章 控制語句與函數(shù) 35
3.1 條件結(jié)構(gòu) 36
3.1.1 條件表達式 36
3.1.2 if語句 36
3.1.3 switch語句 38
3.2 循環(huán)結(jié)構(gòu) 39
3.2.1 for循環(huán) 39
3.2.2 while循環(huán) 40
3.2.3 break語句 40
3.2.4 repeat語句 40
3.3 函數(shù) 41
3.3.1 自定義R函數(shù) 41
3.3.2 返回值 42
3.3.3 函數(shù)的參數(shù) 42
3.3.4 程序的向量化實現(xiàn) 43
3.3.5 apply()函數(shù)族 44
3.3.6 養(yǎng)成良好的代碼編寫習(xí)慣 49
3.4 實訓(xùn) 49
3.5 本章小結(jié) 51
練習(xí)3 51
第4章 數(shù)據(jù)的讀寫與預(yù)處理 53
4.1 數(shù)據(jù)的輸入 54
4.1.1 工作目錄 54
4.1.2 向量的輸入 54
4.1.3 數(shù)據(jù)文件的讀取 55
4.1.4 讀取數(shù)據(jù)文件的注意事項 57
4.2 數(shù)據(jù)的輸出 58
4.2.1 屏幕輸出 58
4.2.2 向量的輸出 58
4.2.3 數(shù)據(jù)文件的輸出 59
4.3 R工作空間的保存和加載 61
4.3.1 R工作空間的保存 61
4.3.2 R工作空間的加載 61
4.4 變量的預(yù)處理 62
4.4.1 變量重編碼 62
4.4.2 變量重命名 63
4.4.3 變量的排序 63
4.4.4 變量類型的轉(zhuǎn)換 64
4.5 字符串的處理 65
4.5.1 字符串分割 65
4.5.2 字符串拼接 66
4.5.3 字符串長度計算 67
4.5.4 字符串截取 68
4.5.5 字符串替換 69
4.5.6 字符串大小寫轉(zhuǎn)換 70
4.5.7 字符串匹配 71
4.5.8 字符串格式化輸出 72
4.5.9 使用stringr包處理字符串 73
4.6 日期變量的處理和轉(zhuǎn)換 75
4.6.1 取系統(tǒng)日期和時間 75
4.6.2 把字符串解析成日期和時間 76
4.6.3 把日期和時間解析成字符串 76
4.6.4 對日期中相關(guān)信息的提取與比較 77
4.6.5 使用lubridate包處理日期變量 77
4.7 清洗重復(fù)數(shù)據(jù) 80
4.7.1 查找是否有重復(fù)值 80
4.7.2 查找重復(fù)值的索引值 80
4.7.3 去除重復(fù)值 81
4.8 缺失數(shù)據(jù)處理 81
4.8.1 缺失數(shù)據(jù)的識別 81
4.8.2 缺失數(shù)據(jù)的處理 82
4.9 異常值識別和處理 83
4.9.1 簡單統(tǒng)計量分析 83
4.9.2 根據(jù)3σ原則檢測異常值 84
4.9.3 根據(jù)箱型圖檢測異常值 84
4.9.4 蓋帽法 85
4.10 數(shù)據(jù)集的合并與拆分 86
4.10.1 數(shù)據(jù)集的合并 86
4.10.2 數(shù)據(jù)集的拆分 89
4.10.3 數(shù)據(jù)集的抽取 89
4.10.4 使用tidyr包 92
4.11 實訓(xùn) 94
4.12 本章小結(jié) 99
練習(xí)4 99
第5章 R語言基本圖形 100
5.1 R語言常見圖形 101
5.1.1 散點圖 101
5.1.2 點圖 102
5.1.3 折線圖 102
5.1.4 曲線圖 103
5.1.5 條形圖 104
5.1.6 餅圖 105
5.1.7 箱線圖 107
5.1.8 直方圖 109
5.2 R語言圖形修飾 109
5.2.1 設(shè)置符號和線條 110
5.2.2 設(shè)置顏色 111
5.2.3 設(shè)置文本屬性 111
5.2.4 添加標(biāo)題 112
5.2.5 添加圖例 113
5.2.6 添加線 113
5.2.7 添加坐標(biāo)軸 115
5.2.8 添加文本標(biāo)注 115
5.3 圖形的布局和保存 116
5.3.1 一頁多圖 116
5.3.2 保存圖形 117
5.4 實訓(xùn) 117
5.5 本章小結(jié) 123
練習(xí)5 123
第6章 ggplot2繪圖基礎(chǔ)和R語言高級繪圖 125
6.1 ggplot2繪圖基礎(chǔ) 126
6.1.1 數(shù)據(jù)(Data) 126
6.1.2 映射(Mapping) 127
6.1.3 幾何對象(Geometric) 128
6.1.4 標(biāo)尺(Scale) 131
6.1.5 統(tǒng)計變換(Statistics) 132
6.1.6 坐標(biāo)系統(tǒng)(Coordinate) 133
6.1.7 圖層(Layer) 134
6.1.8 分面(Facet) 135
6.1.9 主題(Theme) 135
6.1.10 ggplot2繪圖的一般步驟 136
6.2 R語言高級繪圖 136
6.2.1 散點圖矩陣 136
6.2.2 關(guān)系矩陣圖和相關(guān)系數(shù)矩陣 137
6.2.3 橢圓 138
6.2.4 三維散點圖 139
6.2.5 氣泡圖 139
6.2.6 網(wǎng)絡(luò)圖 140
6.2.7 馬賽克圖 141
6.2.8 關(guān)鍵字云 142
6.2.9 雷達圖 143
6.2.10 山巒圖 144
6.2.11 交互圖 146
6.3 實訓(xùn) 146
6.4 本章小結(jié) 155
練習(xí)6 155
第7章 R語言數(shù)據(jù)分析基礎(chǔ) 156
7.1 描述性統(tǒng)計分析 157
7.1.1 常用統(tǒng)計量簡介 157
7.1.2 描述性統(tǒng)計的函數(shù)實現(xiàn) 159
7.2 R語言數(shù)據(jù)分析常用函數(shù) 161
7.3 t-檢驗 164
7.3.1 單樣本t-檢驗 164
7.3.2 配對樣本t-檢驗 165
7.4 相關(guān)分析 166
7.4.1 相關(guān)性概念 166
7.4.2 相關(guān)分析 167
7.5 聚類分析 169
7.5.1 聚類分析的概念 169
7.5.2 計算樣本間的距離 169
7.5.3 計算類與類之間的距離 171
7.5.4 相似系數(shù) 171
7.5.5 聚類分析的主要步驟 172
7.5.6 分層聚類 172
7.5.7 k-means聚類 173
7.5.8 聚類分析的實現(xiàn) 174
7.6 主成分分析 175
7.6.1 主成分分析的基本思想 175
7.6.2 主成分分析的幾何解釋 176
7.6.3 主成分分析的數(shù)學(xué)模型 177
7.6.4 主成分分析的實現(xiàn) 177
7.7 實訓(xùn) 179
7.8 本章小結(jié) 182
練習(xí)7 183
第8章 R語言機器學(xué)習(xí)基礎(chǔ) 184
8.1 機器學(xué)習(xí)概述 185
8.1.1 認(rèn)識機器學(xué)習(xí) 185
8.1.2 機器學(xué)習(xí)的應(yīng)用 185
8.2 機器學(xué)習(xí)分類 186
8.2.1 監(jiān)督學(xué)習(xí) 186
8.2.2 無監(jiān)督學(xué)習(xí) 187
8.2.3 半監(jiān)督學(xué)習(xí) 188
8.3 機器學(xué)習(xí)常用算法 189
8.3.1 線性回歸 189
8.3.2 邏輯回歸 196
8.3.3 聚類 201
8.3.4 神經(jīng)網(wǎng)絡(luò) 204
8.4 機器學(xué)習(xí)基本流程 206
8.4.1 數(shù)據(jù)的收集 206
8.4.2 數(shù)據(jù)預(yù)處理與特征工程 208
8.4.3 模型的選擇與訓(xùn)練 209
8.4.4 模型的評估 209
8.5 實訓(xùn) 210
8.6 本章小結(jié) 214
練習(xí)8 214
第9章 R語言訪問SQL數(shù)據(jù)庫 215
9.1 R語言訪問數(shù)據(jù)庫的基本原理 216
9.2 R語言訪問SQLite數(shù)據(jù)庫 216
9.3 R語言訪問MySQL數(shù)據(jù)庫 219
9.4 R語言訪問Oracle數(shù)據(jù)庫 222
9.5 ODBC和RODBC包介紹 224
9.6 實訓(xùn) 227
9.7 本章小結(jié) 229
練習(xí)9 230
參考文獻 231
- 輸水管線工程風(fēng)險管理 [張勇 黨亥生 著]
- 民用航空飛機標(biāo)準(zhǔn)線路施工 [主編 王志敏 陳明]
- 不息的水脈—大運河講談錄 [趙珩 著]
- 實用運籌學(xué) [主編 邢育紅 于晉臣]
- 三峽梯級電站水資源決策支持系統(tǒng)研究與開發(fā) [姚華明 潘紅忠 湯正]
- 海南黎族民俗文化鑒賞 [龐國華 著]
- 石墨烯在太赫茲及中紅外頻段電磁器件設(shè)計中的應(yīng)用 [李艷秀 莊華偉 著]
- 電子技術(shù)(第二版) [主編 覃愛娜 李飛]
- 辦公自動化高級應(yīng)用 [陳萍 朱曉玉]
- 信息處理技術(shù)員考試32小時通關(guān) [薛大龍]
- 電子產(chǎn)品設(shè)計案例教程(微課版)—基于嘉立創(chuàng)EDA(專業(yè)版) [王靜 莫志宏 陳學(xué)昌 丁紅]
- C程序設(shè)計實踐教程 [劉衛(wèi)國]
- C程序設(shè)計(慕課版) [劉衛(wèi)國]
- Web技術(shù)開發(fā)教程(基于.NET開源MVC框架) [王合闖 韓紅玲 王青正 陳海蕊]
- 商務(wù)英語翻譯教程(筆譯)(第四版) [主編 王軍平]
- 智慧零售技術(shù)與應(yīng)用 [洪旭 著]
- 建設(shè)工程法規(guī)實務(wù) [主編 余瀅]
- 商務(wù)秘書理論與實務(wù)(第三版) [主編 張同欽]
- 程序設(shè)計基礎(chǔ)實踐教程(C/C++語言版) [張桂芬 葛麗娜]
- C++案例項目精講 [主編 楊國興]
- 勞動爭議處理實務(wù) [主編 王秀卿 羅靜]
- 工程數(shù)學(xué) [主編 郭立娟 王海]
- 語音識別理論與實踐 [主編 莫宏偉]
- 信息系統(tǒng)項目管理師章節(jié)習(xí)題與考點特訓(xùn)(第二版) [主編 薛大龍]
- 武術(shù)基礎(chǔ)教程 [主編 李代勇 謝志民]
- 計算機網(wǎng)絡(luò)實訓(xùn)教程 [主編 張浩軍 趙玉娟]
- 畫法幾何與機械制圖習(xí)題集(多學(xué)時) [主編 趙軍]
- HCIA-Datacom認(rèn)證題庫分類精講 [主 編 韓立剛]
- SwiftUI完全開發(fā) [李智威 著]
- 網(wǎng)絡(luò)規(guī)劃設(shè)計師備考一本通 [夏杰 編著]
- 大數(shù)據(jù)技術(shù)導(dǎo)論
- HBase分布式存儲系統(tǒng)應(yīng)用(第二版)
- Hive編程技術(shù)與應(yīng)用(第二版)
- Python 語言程序設(shè)計實踐指導(dǎo)
- Spark大數(shù)據(jù)處理技術(shù)
- 數(shù)據(jù)清洗
- R語言基礎(chǔ)及應(yīng)用
- 數(shù)據(jù)庫原理及應(yīng)用(MySQL版)
- 大數(shù)據(jù)導(dǎo)論
- 大數(shù)據(jù)可視化技術(shù)
- Python語言程序設(shè)計
- Java編程基礎(chǔ)
- Java編程基礎(chǔ)實踐指導(dǎo)
- 深度學(xué)習(xí)—卷積神經(jīng)網(wǎng)絡(luò)算法原理與應(yīng)用
- Hive編程技術(shù)與應(yīng)用
- HBase分布式存儲系統(tǒng)應(yīng)用