数据挖掘系统的设计与实现(毕业论文)(6)

2019-05-17 09:57

武汉工程大学本科毕业设计

第二章 设计部分

2.1环境的选择与搭建

在确定数据挖掘系统应当具备的基本功能之后,需要进行环境的选择与搭建。在目前接触的几种相对热门的语言之中,比较java,C,C++。Java语言相对于其他两门语言具有明显的几样优势:

1.健壮性。Java的强类型机制、异常处理、废料的自动收集等是Java程序健壮性的重要保证。对指针的丢弃是Java的明智选择。Java的安全检查机制使得Java更具健壮性。

2.安全性。Java通常被用在网络环境中,为此,Java提供了一个安全机制以防恶意代码的攻击。除了Java语言具有的许多安全特性以外,Java对通过网络下载的类具有一个安全防范机制(类ClassLoader),如分配不同的名字空间以防替代本地的同名类、字节代码检查,并提供安全管理机制(类SecurityManager)让Java应用设置安全哨兵。

3.平台中立性。Java程序(后缀为java的文件)在Java平台上被编译为体系结构中立的字节码格式(后缀为class的文件), 然后可以在实现这个Java平台的任何系统中运行。这种途径适合于异构的网络环境和软件的分发。

4.良好的移植性。这种可移植性来源于体系结构中立性,另外,Java还严格规定了各个基本数据类型的长度。Java系统本身也具有很强的可移植性,Java编译器是用Java实现的,Java的运行环境是用ANSI C实现的。

5.高效性。与那些解释型的高级脚本语言相比,Java的确是高性能的。事实上,Java的运行速度随着JIT(Just-In-Time)编译器技术的发展越来越接近于C++。

Java语言的这些其他语言不具备优良特性使得Java应用具有无比的健壮性和可靠性,这也减少了应用系统的维护费用。Java对对象技术的全面支持和Java平台内嵌的API能缩短应用系统的开发时间并降低成本。Java的编译一次,到处可运行的特性使得它能够提供一个随处可用的开放结构和在多平台之间传递信息的低成本方式。

数据挖掘系统更是需要有良好的安全性,而且能够在不同平台之间进行良好的沟通与数据整合,对庞大的数据能够进行迅速准确的处理,基于数据挖掘系统的特性,JAVA语言无疑是首要的选择。

21

武汉工程大学本科毕业设计

在确定所使用的语言之后,就需要考虑与之匹配的工具。对于目前主要的JAVA开发工具,eclipse无疑是首选。Eclipse不仅目前被广泛应用,使用该开发工具就意味着代码可以与大多数开发者同步,而且该工具更是开源的,在官方网站能够随时免费下载,所以就选择Eclipse作为开发工具。

数据挖掘系统主要是面对庞大的数据进行各式各样的操作,数据库就是进行设计过程中不得不慎重考虑选择的对象。MYSQL由于其体积小、速度快、总体拥有成本低,尤其是开放源码这一特点,在这里就选择MYSQL作为数据挖掘系统的数据库。

确定平台和工具之后,就是要进行JAVA环境的搭建。由于Java是平台无关的,安装JDK时Java不会自动设置路径,也不会修改注册表,需要用户自己设置环境变量,但不需要修改注册表。

Windows中需要设置两个环境变量path和classpath。Path变量指出Java提供的可执行文件的路径,classpath变量指出Java包的路径。右键单击“我的电脑”,在弹出的快捷菜单中选择“属性”,在弹出的“系统属性”对话框中选择“高级”选项卡,单击“环境变量”按钮,系统弹出“环境变量”对话框,path是Windows已经定义的变量。找到“path”,单击“编辑”按钮,然后单击“确定”按钮。向path变量添加的是JDK编译器javac.exe和解释器java.exe的路径。如果Windows中没有path变量,则需要新建。通常,Windows中没有classpath环境变量,需要新建。单击“新建”按钮,变量名称为“classpath”,变量值为“,;C:\\Program Files\\Java\\jdk 1.5.0\\lib”,这是JDK包(类库)的路径。注意:这两个环境变量都必须加在“环境变量”列表框中,不能加在“用户变量”中。

设置环境变量需要注意的事项如下:

1.上面所示的路径是JDK的默认安装路径,环境变量的值需要根据实的安装路径而更改。Windows系统不区分字母大小写,因此变量名和路径字符串中字母大小写均可。

2.“path=%path%”表示path的原有路径,可以省略。如果省略,同时省略分号“;”,此时path原路径将不复存在,可能会影响其他程序运行。

3.classpath值中的“.”表示当前目录,通常写在最前面,作为系统查找类的第一个路径。

2.2系统需要实现的功能

在开始进行设计时,首先考虑数据库挖掘系统应当具备以下功能:

22

武汉工程大学本科毕业设计

数据采集客户端数据采集服务器数据读取模块数据匹配模块数据存储模块数据库/var/adm/wtmpx数据发送模块数据接收模块数据整合模块图2. 1系统功能

数据读取模块:负责从用户登录记录文件和未匹配登录记录文件中读取用户的登录记录数据,将其转化为LogRec对象,然后传递给数据匹配模块匹配。

数据匹配模块:负责将用户登录记录数据,按照登入/登出的关系匹配起来,形成匹配的用户登录记录数据(MatchedLogRec对象),并计算出每次登录的时间长度。

数据发送模块:将匹配好的用户登录记录通过网络发送到采集系统服务器。 数据接收模块:服务器端接收匹配好的用户登录记录数据。

数据保存模块:将接受到的用户登录记录数据保存到数据库的用户登录记录明细表中。

数据整合模块:将用户登录记录明细表中的数据整合成日报表,月报表和年报表。 2.3系统用例 2.3.1用例图

23

武汉工程大学本科毕业设计

读取上次未匹配的登入记录读取用户登录数据文件匹配登录记录数据读取数据匹配保存未匹配的登入记录DMS管理员数据采集数据发送数据整合数据保存数据接收整合出日表整合出月报表整合出年报表

图2. 2 DMS系统用例图

2.3.2用例描述

表2. 1数据采集

用例名称 功能简述 前置条件 基本流 数据采集 DMS管理员运行DMS程序,完成数据采集的功能 DMS程序已正确安装并部署 1. DMS管理员启动DMS服务端程序 2. DMS管理员启动DMS客户端程序 3. DMS客户端程序读取上次未匹配的登入记录 4. DMS客户端程序读取用户登录数据文件 5. DMS客户端程序得到用户登入/登出记录列表 6. DMS客户端程序将用户的登入和登出记录按照对应关系匹配成完整的登录记录 7. DMS客户端程序将不能成功匹配的登入记录写到文件中保存 8. DMS客户端程序将匹配好的登录记录发送到数据采集服务端 9. DMS服务端程序接收采集的数据 10. DMS服务端程序将数据写到服务端文件中保存下来 第1步,若启动服务端程序失败,则报告异常。 第2步,若启动客户端程序失败,则报告异常。 第3步,若上次未匹配的登入记录文件不存在,则跳过到第3步。 第4步,若读取用户登录数据文件失败,则报告异常。 第7步,若指定的写出目录不存在,则创建目录。 第7步,若创建目录或写文件失败,则报告异常。 第8步,若发送数据失败,则定时重传。 第10步,若写入文件失败,则报告异常。 无 无 24

分支与异常 后置条件 备注

武汉工程大学本科毕业设计

表2. 2数据读取

用例名称 功能简述 前置条件 基本流 数据读取 DMS程序读取系统数据文件和上次未匹配的登入记录,形成用户登录记录列表。 DMS客户端程序启动 1. 根据系统配置信息确定上次未匹配的登入记录文件的位置。 2. 读取上次未匹配的登入记录,形成用户登录记录列表。 3. 根据系统配置信息确定用户登录数据文件的位置。 4. 读取数据文件,将文件内容解析成用户登录记录。 5. 将上一步中解析得到的用户登录记录添加到列表中。 6. 返回用户登录记录列表。 第2步,若上次未匹配的登入记录文件不存在,则跳过到第3步。 第4步,若用户登录数据文件不存在,则报告异常。 无 无 分支与异常 后置条件 备注 读取上次未匹配的登入记录

表2. 3匹配上次未登入

用例名称 功能简述 前置条件 基本流 读取上次未匹配的登入记录 DMS程序读取上次未匹配的登入记录,形成用户登录记录列表。 DMS客户端程序启动 1. 根据系统配置信息确定上次未匹配的登入记录文件的位置。 2. 读取文件内容,将数据解析成用户登入记录。 3. 创建内存列表,保存读取到的登入记录数据。 4. 清空未匹配的登入记录文件。 第2步,若上次未匹配的登入记录文件不存在,则结束此用例。 第2步,若读取文件失败,则报告异常。 第4步,若清空文件失败,则报告异常。 无 无 分支与异常 后置条件 备注

读取用户登录数据文件

25


数据挖掘系统的设计与实现(毕业论文)(6).doc 将本文的Word文档下载到电脑 下载失败或者文档不完整,请联系客服人员解决!

下一篇:何雨春同志在全市党建和群团工作会议上的讲话

相关阅读
本类排行
× 注册会员免费下载(下载后可以自由复制和排版)

马上注册会员

注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信: QQ: