試卷質(zhì)量統(tǒng)計分析與數(shù)據(jù)挖掘原理、設計與實現(xiàn)
簡介
本書特色
前言
章節(jié)列表
精彩閱讀
下載資源
相關圖書
試卷分析是了解學生對知識點掌握程度、教師出題情況的第一手材料,針對于試卷的數(shù)據(jù)挖掘可得出試卷的潛在信息規(guī)則,便于決策者調(diào)整教學計劃、教學方法和手段,提高教學質(zhì)量。基于以上原因,在大量研究和長時間應用的基礎上編著了此書。
本書共五章,包括兩部分:第一部分包括三章,第1章論述試卷質(zhì)量分析的意義及現(xiàn)狀;第2章介紹基本統(tǒng)計學原理;第3章介紹試卷質(zhì)量分析系統(tǒng)設計。第二部分包括兩章,第4章介紹相關數(shù)據(jù)挖掘算法;第5章介紹數(shù)據(jù)挖掘的實現(xiàn)。
本書可作為本科生學習教育統(tǒng)計學應用、數(shù)據(jù)庫技術、數(shù)據(jù)挖掘理論及應用、程序設計等領域知識的參考書,也可為研究生和教育研究及決策者在進行試卷分析和數(shù)據(jù)挖掘理論研究、軟件設計方面提供幫助。
為迎接2006年的本科教育水平評估,內(nèi)蒙古民族大學決定設計一套學生試卷分析軟件供全校使用,同時進行了兩次立項,首先是2003年的《學生試卷分析系統(tǒng)》,當時查詢了很多資料,很多學校也編寫了這樣的系統(tǒng),大部分是圍繞著整個試卷的總分進行一般性的統(tǒng)計學分析,沒有進行更深層次的研究。所以,本書從學生試卷的小分出發(fā),把分析工作定位到每個小題,除進行一般性統(tǒng)計分析外,又在教師漏題方面進行了分析,在班級的縱向和橫向方面做了一些比較工作,進而也在分析結果可視化方面做出貢獻。
2007年申請內(nèi)蒙古自治區(qū)教育廳立項為《基于多策略的學生成績數(shù)據(jù)挖掘及分類培養(yǎng)決策支持》,目的是想進一步在數(shù)據(jù)挖掘和決策支持方面進行研究。本書在此課題的基礎上,從加快掃描速度、低頻規(guī)則的發(fā)現(xiàn)方面對Apriori算法做了比較深入的研究,提出應用縱橫距離法進行異常成績檢測和應用三次參數(shù)樣條函數(shù)方法進行丟失數(shù)據(jù)的修補。在模糊聚類分析(FCM)方面、決策樹方面也進行了比較深入的研究,同時取得了一些相應的研究成果。
經(jīng)過查閱很多資料,發(fā)現(xiàn)國內(nèi)在學生成績分析與數(shù)據(jù)挖掘方面的成果難登大雅之堂,使得這方面的有價值的資料很少,但個人認為自己的研究比較系統(tǒng),在試卷質(zhì)量分析和數(shù)據(jù)挖掘方面有獨到的見解,并取得了一定的成果,所以產(chǎn)生了寫一部專著的想法。
1.試卷分析方面
針對試卷質(zhì)量分析和學生考試成績分析的要求,首先進行了有關試卷分析的統(tǒng)計學指標介紹,包括最高分、最低分、平均分、分數(shù)段分布,同時也對難度、易度、區(qū)分度、方差、標準差等進行了介紹,著重介紹這些指標對試卷質(zhì)量評價的影響。
同時給出了正態(tài)分布和峰值的判斷原理,并通過峰值等判斷實現(xiàn)對試卷質(zhì)量的自動評語。
依據(jù)統(tǒng)計分析的基本理論以及學校的具體要求,進行了需求分析、數(shù)據(jù)庫邏輯設計以及程序的總體設計,實現(xiàn)了各模塊的基本功能,尤其是自動評語的產(chǎn)生。
2.可視化方面
本書進行了試卷質(zhì)量分析報表設計,同時通過可視化的形式,顯示統(tǒng)計結果。并且公布具體的算法和程序設計方法以及全部的源代碼,對想在此方面進行研究的人員提供有價值的資料,同時也可以作為學生學習編程的案例教程。
3.數(shù)據(jù)挖掘方面
基于數(shù)據(jù)挖掘理論,提出應用三次參數(shù)樣條函數(shù)法對部分缺失數(shù)據(jù)進行修補;提出應用縱橫距離檢測算法實現(xiàn)異常成績挖掘;為加快挖掘速度,提出基于數(shù)據(jù)庫一次掃描的Aprior算法;針對Aprior算法基于高頻的缺點,提出基于群體局部特征分段支持度的Aprior算法,實現(xiàn)對經(jīng)典Aprior算法的擴充,對低頻規(guī)則進行挖掘;提出應用決策樹算法實現(xiàn)對學生成績的挖掘。
本書給出全部的算法和部分源代碼,方便讀者將其應用到其他的知識領域。
在完成基礎研究和這部專著過程中,引用了別人的成果,將在本書的參考文獻中列出,在此表示誠摯的感謝,同時感謝在此項工作中給予支持的所有同仁。書中所列的觀點是一家之言,僅代表個人觀點,由于個人的水平和所涉獵的知識有限,不足和錯誤之處在所難免,希望各位同仁批評指正。
張春生
2011年11月
第1章 緒論 1
1.1 試卷質(zhì)量分析的意義及現(xiàn)狀 1
1.2 本書的主要工作 5
第2章 基本統(tǒng)計學原理 6
2.1 一般統(tǒng)計指標 6
2.2 難度、易度 7
2.3 區(qū)分度 8
2.4 試卷信度 9
2.5 試卷效度 10
2.6 正態(tài)分布的判斷 11
2.7 自動評語的產(chǎn)生 12
第3章 試卷質(zhì)量分析系統(tǒng)設計 14
3.1 數(shù)據(jù)庫設計 14
3.2 程序總體結構 19
3.3 主要功能模塊實現(xiàn) 21
3.3.1 主程序設計 21
3.3.2 基本數(shù)據(jù)輸入程序設計 28
3.3.3 試卷分析 32
3.3.4 信息維護 38
3.3.5 系統(tǒng)維護 39
3.4 報表設計 42
3.5 教師分析 47
3.6 多維數(shù)據(jù)顯示 59
第4章 相關數(shù)據(jù)挖掘算法 68
4.1 異常成績發(fā)現(xiàn) 72
4.2 缺失成績的修補 76
4.3 關聯(lián)規(guī)則 80
4.4 關聯(lián)規(guī)則算法的優(yōu)化 84
4.4.1 改進Apriori算法描述 85
4.4.2 算法描述 86
4.5 局部特征的知識發(fā)現(xiàn) 88
4.5.1 基于分段支持度的Apriori算法基本原理 89
4.5.2 基于分段支持度的Apriori算法描述 91
4.6 決策樹算法 91
4.6.1 決策樹方法概述 92
4.6.2 數(shù)據(jù)挖掘中決策樹算法的主要進展 93
4.6.3 面臨的挑戰(zhàn)與發(fā)展趨勢 99
4.7 模糊聚類算法(FCM) 100
4.7.1 模糊集基本知識 100
4.7.2 K均值聚類算法(HCM)介紹 100
4.7.3 模糊C均值聚類 102
4.7.4 FCM算法的應用 104
第5章 數(shù)據(jù)挖掘的實現(xiàn) 105
5.1 數(shù)據(jù)庫一次掃描Apriori算法 105
5.2 部分缺失數(shù)據(jù)的三次參數(shù)樣條函數(shù)修補方法 115
5.3 基于縱橫距離的異常點檢測算法及應用 116
5.4 基于分段支持度Apriori算法 123
5.5 決策樹分析方法 133
5.6 模糊聚類算法實現(xiàn) 140
參考文獻 153