文档名称 文档密级
图 15 使用UltraEdit打开解析后MR数据
对于解析后成规格的TXT文档,若文件较小,可以使用UltraEdit或Excel处理;若文件较大,则需要使用Microsoft SQL Server进行处理。
需要声明一点的是,目前“MR原型工具”非常原始,且未纳入公司License管理系统,所以暂时适用范围较小。
5.3.2.2.3. Microsoft SQL Server
Microsoft SQL Server是进行海量数据分析处理的利器!SQL Server的安装、一般使用方法请参考相应指导书(百度中也有很多资源)。此处只介绍与MR分析相关的操作。
在图 14所示中可以看到,“上行ISCP”这个测量量的解析结果文件达到了2.7G以上。于是我们需要将这样庞大的数据,导入SQL Server数据库,以方便分析,具体方法介绍如下。 (1) 打开SQL Server的“企业管理器”,新建一个专门存放MR数据的数据库,如图 16
所示:
2013-4-21
华为机密,未经许可不得扩散 第26页, 共35页
文档名称 文档密级
图 16 新建MR数据存放数据库
(2) 在新建数据库右边空白处点击鼠标右键,选择“导入数据”,如图 17所示:
图 17 向新建数据库导入数据
(3) 注意选择导入数据源为“文本文档”,并选择需要导入的文件的路径,如图 18所示:
2013-4-21
华为机密,未经许可不得扩散 第27页, 共35页
文档名称 文档密级
图 18 选择数据源为“文本文档”
(4) 注意要选择“第一行含有列名称”,否则TXT文档的第一行会被当作新建数据表的内
容,如图 19所示:
图 19 选择“第一行含有列名称”
(5) 选择“制表符”分割数据列,如图 20所示:
2013-4-21
华为机密,未经许可不得扩散 第28页, 共35页
文档名称 文档密级
图 20 选择“制表符”
(6) 注意导入的目的数据库要选择准确,图 21所示选择的就是刚刚新建立的数据库:
图 21 选准确需要导入的数据库
(7) 注意修改导入数据的数据类型,点击“转换”后,在“类型”下选择需要将导入数
据转换为哪种类型;通常建议,IMSI转换为“varchar”,其余均转换为“bigint”;否则默认全部为“varcha”类型,会给后面数据分析带来很大不方便,如图 22所示:
2013-4-21
华为机密,未经许可不得扩散
第29页, 共35页
文档名称 文档密级
图 22 按照需要将导入数据转换为合适类型
(8) 点击“完成”,SQL Server即开始进行数据导入;完成数据导入后,点击“表”即可
看到如图 23所示的新建数据表(必要时需要“刷新”一下):
图 23 完成导入任务的数据列表
(9) 图 24所示是一个导入后的数据表的范例,后面第节的操作,就是针对这些数据表
进行:
2013-4-21
华为机密,未经许可不得扩散
第30页, 共35页