移动决策 数据挖掘 决策树
Technology/Application
技术/
应用
基于决策树的数据挖掘技术
在电信用户流失预测的应用与研究
□张献华田亮
中国通信业进入21世纪后,已经从20世纪末期的高速增长期进入了一个增长速度相对较缓的稳步增长期。一方面,随着有实力的国内外运营商通过各种方式不断渗透或加入到通信市场,行业内部竞争日趋白炽化;另一方面,消费者面对的移动通信服务选择愈来愈多,消费者对移动通信业的服务要求也愈来愈高,消费者已不再满足简单地能使用电话这一低层次的水平上,更要求在服务功能及服务水平上得到满足。面对如此严峻的环境,电信运营商必须找到一有效的途径吸引新用户,保持老用户并不断提升用户的利润贡献。同时近年来,随着电信业务迅猛增长,交易处理数据激增,如此海量的数据背后隐藏着重要信息,电信运营商期望能发现用户消费习惯与用户地个区、年龄和性别之间的关系,为制定新业务、性化服务提供参考,预测用户消费趋势变化以期达到吸引新用户保持老户并不断提升用户对企业利润的贡献。
数据挖掘,也可以称为数据库中的知识发现(Knowledge
叶幸春
的代价自由改变通信运营商,如何保持现存用户并挖掘其持久性盈收潜力就成了通信运营商关注的焦点。
本文以电信用户流失分析系统为例,具体介绍了从生产数据库中提取数据利用决策树方法进行数据挖掘,建立流失模型,再将分析数据导入模型进行预测,及时地为电信运营商提供挽留决策依据,使电信服务业真正达到以用户为中心。
决策树分析方法
用户流失预测的本质是将用户进行分类,分类是一种非常重要的数据挖掘方法,分类的概念是在已有数据的基础上构造出一个分类模型,该模型能够把生产数据库中的数据记录映射到预定义类别中的某一个,从而可以应用于提前预测,实现提前预知用户消费趋势的转向点。所谓决策树,就是在对数据进行决策分类时利用树的结构将数据记录进行分类,其中树的一个叶结点就代表符合某个条件的属性集,根据属性的不同取值建立决策树的各个分决策树支;随后递归的构造每个子节点的子树。作为数据挖掘技术中一种分类问题的解决方法,适用于特征数量较小的高质量分类,并且分类结果有很强的解释力度便于认识理解而被广泛应用和研究。
DiscoveryinDatabase,
不完全的、有噪声的、模糊KDD),是从大量的、
的、随机的数据中,提取出隐含在其中的、人们事先不知道的、但又是可信的、新颖的、有效的并能被人理解的信息的高级处理过程。其商业应用可以描述为:按企业既定业务目标,对大量的企业数据进行探索和分析,揭示隐藏的、未知的或验证已知的规律性,并进一步将其模型化的先进有效的方法。
当前对于一个电信行业这一成熟化的市场,引入一个新用户往往比保持一个现有用户代价更高,而且在短期内新用户往往比已有用户带来的收益更少,同时现有用户可以用极小
用户流失分析系统的实现
(一)分析系统体系结构
系统体系结构如图1所示,系统主要由四部分构成—分析系统、结果展现——生产系统、系统、维系挽留系统。根据流失用户定义通过接口从生产系统中提取相关数据,在分析系统
CHINANEWTELECOMMUNICATIONS
79
中国新通信