龙源期刊网 http://www.qikan.com.cn
浅谈远程教育智能在线答疑系统中的数据挖掘设计
作者:吴虹
来源:《中国新通信》2014年第21期
【摘要】 随着计算机技术的发达,远程教育已经成为现代教育的重要方式之一。智能在线答疑系统能够实现教育资源的优化共享,并且为学生提供教学辅导和交流机会,因此具有积极意义。但其数据挖掘的设计还存在一定的技术问题,为了解决这一问题,文章将我国远程教育智能在线答疑系统的数据挖掘设计过程进行了具体的阐述和分析。 【关键词】 远程教育 智能答疑系统 数据挖掘 设计 网络日志
远程教育已经得到越来越多教育者的认可,其优势在于提高了教学效率,节约了时间,并且解决了空间上的问题。但学员分散,问题不集中是主要问题。因此建立在线答疑系统并实现其智能化十分重要。远程教育答疑系统经历了多个阶段的发展,目前已经取得了一定的成就。其中,数据挖掘技术的提高是其关键点,个性化学习导航的设计在这个过程中起到了积极的作用。
一、基于网络日志的数据挖掘方法
智能在线答疑系统由持久数据与即时数据组成。前者支持在线答疑涉及的资料和数据库。后者是对读者信息的记录,产生于操作者的系统应用过程中。根据即时信息可了解学习者状态,学习行为以及出现问题的信息记录,尤其是用来分析用户的特定知识理解能力。为了确保导航系统的高效性,数据挖掘应采取分层信息资源记录方式。通过这些信息,学习者的学习状态,存在问题清晰可见。学校可为学生解决其提问频率相对较高的内容。以Web服务器日志访问为例,被访问的服务器会产生相应的系统日志,这些日志就是用户的主要表现。其主要内容包括:访问者的网络IP 、时间戳、访问方法、被访问文件的URL及其协议、状态请求、数字传输的字节等。Web服务器将完整的记录用户的登录信息,因此其设计方法应考虑对日志的预处理后的结果。其中,请求页面和服务器提问页面将保存用户信息。基于文献提出方法,对用户日志文件进行处理,对原始Web日志产生的数据进行处理,使其能够与数据挖掘方法相适应,以便于实现网络日志数据挖掘的实施。其流程主要包括:
(1)数据净化:即过滤Web日志提供的有效数据,以便于对用户状态进行分析。其中包括:登录者的IP与ID、用户申请和浏览的页面以及访问实践和内容以及错误代码在内。但文章所研究的数据挖掘实际上只与用户的IP地址、登录ID和浏览页面具有直接关系,也就是其访问的信息,与网页本身的性能和产生的错误信息无关,因此可单独研究与其相关的用户访问记录。通过数据净化,删除与用户数据挖掘无关的信息,实现快速数据挖掘,解决网络用户的问题。