本科课程设计及实验
期末成绩评估系统的数据仓库和数据挖掘设计
课 程 名 称: 数据挖掘 课 程 编 号: 08060116 学 生 姓 名: cwl 学 号: 2008052251 学 院: 信息科学技术学院 系: 计算机科学系 专 业: 软件工程 指 导 教 师: lb 教 师 单 位: 信息学院计算机系
开 课 时 间: 2010 ~ 2011 学年度第 二 学期
2011年 06月 20日
暨南大学---数据挖掘课程设计---cwl
第1章 概述
1.1应用背景和问题的提出
在大学生活中,我们大学生在某种程度上还是比较重视自己的课程成绩的。而有一个期末最终成绩的评估系统,无疑对同学们而言是很有用的。在这个系统中,只需输入你估计的平时成绩以及表现和期末考试的得分,就可以预测出最终的成绩。而这个课程成绩的组成以及得出是怎么样的呢。这个最终的得分是受到什么影响呢?本论文就以上问题进行了探讨和挖掘。
1.2设计内容的介绍
本课程设计主要是探讨和研究在老师给定成绩时考虑的因素,以及这些因素所占的比例。数据仓库为一份记录着600个同学的得分情况的数据,数据挖掘则采用决策树探究出影响结婚年龄的因素。
第2章 数据仓库设计
2.1概念模型设计
数据仓库里面有一个实体,也就是成绩score。成绩的决定因素有performance也就平时表现情况,即根据其在课堂上的活跃程度以及认真听课的情况来给的分,还有averscore就是同学平时的作业得分以及平时测试或者期中测试的平均成绩,以及期末考试的成绩lasttest。
2
暨南大学---数据挖掘课程设计---cwl
averscore
performance lasttest score 2.2逻辑模型设计
本数据仓库只有一个表,逻辑模型设计如下:
2.3物理模型设计
在数据仓库的物理设计中,主要解决数据的存储结构、数据的索引策略、数据的存储策略、存储分配优化等问题。物理设计的主要目的有两个,一是提高性能,二是更好地管理存储的数据。访问的频率、数据容量、选择的RDBMS支持的特性和存储介质的配置都会影响物理设计的最终结果。在本数据挖掘中,数据的索引策略采取的并不是位图索引而是按列索引
3
暨南大学---数据挖掘课程设计---cwl
2.4 OLAP模型设计
在本设计中由于案例考虑的并不复杂,所以OLAP模型设计也就比较的简单。 下面的数据是保存在Excel中的。大概的模型设计也就如下图所示。
4
暨南大学---数据挖掘课程设计---cwl
2.5 OLAP前端展示设计
第3章 数据挖掘分析
3.1 期末成绩评估系统应用挖掘概述
在本系统中,数据仓库采用一个二维表来存储和表示同学们的平时成绩,平时表现得分,以及期末成绩等属性。数据挖掘则采用关联分析来将二维表中的实例分开,并探究这些数据所蕴含的规律。
5