試卷質量統計分析與數據挖掘原理、設計與實現

簡介
本書特色
前言
章節列表
精彩閱讀
下載資源
相關圖書
試卷分析是了解學生對知識點掌握程度、教師出題情況的第一手材料,針對于試卷的數據挖掘可得出試卷的潛在信息規則,便于決策者調整教學計劃、教學方法和手段,提高教學質量。基于以上原因,在大量研究和長時間應用的基礎上編著了此書。
本書共五章,包括兩部分:第一部分包括三章,第1章論述試卷質量分析的意義及現狀;第2章介紹基本統計學原理;第3章介紹試卷質量分析系統設計。第二部分包括兩章,第4章介紹相關數據挖掘算法;第5章介紹數據挖掘的實現。
本書可作為本科生學習教育統計學應用、數據庫技術、數據挖掘理論及應用、程序設計等領域知識的參考書,也可為研究生和教育研究及決策者在進行試卷分析和數據挖掘理論研究、軟件設計方面提供幫助。
為迎接2006年的本科教育水平評估,內蒙古民族大學決定設計一套學生試卷分析軟件供全校使用,同時進行了兩次立項,首先是2003年的《學生試卷分析系統》,當時查詢了很多資料,很多學校也編寫了這樣的系統,大部分是圍繞著整個試卷的總分進行一般性的統計學分析,沒有進行更深層次的研究。所以,本書從學生試卷的小分出發,把分析工作定位到每個小題,除進行一般性統計分析外,又在教師漏題方面進行了分析,在班級的縱向和橫向方面做了一些比較工作,進而也在分析結果可視化方面做出貢獻。
2007年申請內蒙古自治區教育廳立項為《基于多策略的學生成績數據挖掘及分類培養決策支持》,目的是想進一步在數據挖掘和決策支持方面進行研究。本書在此課題的基礎上,從加快掃描速度、低頻規則的發現方面對Apriori算法做了比較深入的研究,提出應用縱橫距離法進行異常成績檢測和應用三次參數樣條函數方法進行丟失數據的修補。在模糊聚類分析(FCM)方面、決策樹方面也進行了比較深入的研究,同時取得了一些相應的研究成果。
經過查閱很多資料,發現國內在學生成績分析與數據挖掘方面的成果難登大雅之堂,使得這方面的有價值的資料很少,但個人認為自己的研究比較系統,在試卷質量分析和數據挖掘方面有獨到的見解,并取得了一定的成果,所以產生了寫一部專著的想法。
1.試卷分析方面
針對試卷質量分析和學生考試成績分析的要求,首先進行了有關試卷分析的統計學指標介紹,包括最高分、最低分、平均分、分數段分布,同時也對難度、易度、區分度、方差、標準差等進行了介紹,著重介紹這些指標對試卷質量評價的影響。
同時給出了正態分布和峰值的判斷原理,并通過峰值等判斷實現對試卷質量的自動評語。
依據統計分析的基本理論以及學校的具體要求,進行了需求分析、數據庫邏輯設計以及程序的總體設計,實現了各模塊的基本功能,尤其是自動評語的產生。
2.可視化方面
本書進行了試卷質量分析報表設計,同時通過可視化的形式,顯示統計結果。并且公布具體的算法和程序設計方法以及全部的源代碼,對想在此方面進行研究的人員提供有價值的資料,同時也可以作為學生學習編程的案例教程。
3.數據挖掘方面
基于數據挖掘理論,提出應用三次參數樣條函數法對部分缺失數據進行修補;提出應用縱橫距離檢測算法實現異常成績挖掘;為加快挖掘速度,提出基于數據庫一次掃描的Aprior算法;針對Aprior算法基于高頻的缺點,提出基于群體局部特征分段支持度的Aprior算法,實現對經典Aprior算法的擴充,對低頻規則進行挖掘;提出應用決策樹算法實現對學生成績的挖掘。
本書給出全部的算法和部分源代碼,方便讀者將其應用到其他的知識領域。
在完成基礎研究和這部專著過程中,引用了別人的成果,將在本書的參考文獻中列出,在此表示誠摯的感謝,同時感謝在此項工作中給予支持的所有同仁。書中所列的觀點是一家之言,僅代表個人觀點,由于個人的水平和所涉獵的知識有限,不足和錯誤之處在所難免,希望各位同仁批評指正。
張春生
2011年11月
第1章 緒論 1
1.1 試卷質量分析的意義及現狀 1
1.2 本書的主要工作 5
第2章 基本統計學原理 6
2.1 一般統計指標 6
2.2 難度、易度 7
2.3 區分度 8
2.4 試卷信度 9
2.5 試卷效度 10
2.6 正態分布的判斷 11
2.7 自動評語的產生 12
第3章 試卷質量分析系統設計 14
3.1 數據庫設計 14
3.2 程序總體結構 19
3.3 主要功能模塊實現 21
3.3.1 主程序設計 21
3.3.2 基本數據輸入程序設計 28
3.3.3 試卷分析 32
3.3.4 信息維護 38
3.3.5 系統維護 39
3.4 報表設計 42
3.5 教師分析 47
3.6 多維數據顯示 59
第4章 相關數據挖掘算法 68
4.1 異常成績發現 72
4.2 缺失成績的修補 76
4.3 關聯規則 80
4.4 關聯規則算法的優化 84
4.4.1 改進Apriori算法描述 85
4.4.2 算法描述 86
4.5 局部特征的知識發現 88
4.5.1 基于分段支持度的Apriori算法基本原理 89
4.5.2 基于分段支持度的Apriori算法描述 91
4.6 決策樹算法 91
4.6.1 決策樹方法概述 92
4.6.2 數據挖掘中決策樹算法的主要進展 93
4.6.3 面臨的挑戰與發展趨勢 99
4.7 模糊聚類算法(FCM) 100
4.7.1 模糊集基本知識 100
4.7.2 K均值聚類算法(HCM)介紹 100
4.7.3 模糊C均值聚類 102
4.7.4 FCM算法的應用 104
第5章 數據挖掘的實現 105
5.1 數據庫一次掃描Apriori算法 105
5.2 部分缺失數據的三次參數樣條函數修補方法 115
5.3 基于縱橫距離的異常點檢測算法及應用 116
5.4 基于分段支持度Apriori算法 123
5.5 決策樹分析方法 133
5.6 模糊聚類算法實現 140
參考文獻 153