I1作案手段 迷信 技术开锁 冒充军人、干部 撬防盗门 利用口香糖技术开锁 飞车抢夺 插片开锁 夜间攀爬翻窗 I2作案特点 多人作案 单人作案 单人作案 入室作案 入室作案 多人作案 多人作案 多人作案 I3案件类型 I4选择处所 诈骗 盗窃车内财物 诈骗 入室盗窃 入室盗窃 抢夺 入室盗窃 入室盗窃 街面 路面 工商企业 居民小区 居民小区 I5行政区划 340823 411528 412825 430427 431224 440229 452728 513428 区划名称 安徽枞阳县 河南息县 河南上蔡县 湖南耒阳市 湖南溆浦县 广东翁源县 广西东兰县 四川凉山籍 表2:高危人群样例数据
(3)运用串并案模板对现行案件进行串并,并根据案件特征(作案手段、作案特点、案件类型、选择处所等)比对高危人群数据库,推荐出可能作案的高危人群。
图6:运用串并案模板进行串并案件
(4)建立符合可能作案的高危人群特征(户籍地)的违法犯罪人员活动轨迹数据库,构建案件轨迹与嫌疑人员活动轨迹的空间和时间矢量矩阵,通过计算矢量距离,推导出与案件时间、轨迹吻合度最高,且符合案件特征的可能的作案嫌疑人。表3展示了一串案件发生时,6个符合特征的嫌疑人手机位置与案件发生地点的空间矢量距离,null表示没有
11 / 14
发现其活动信息。
案件1 案件2 案件3 案件4 嫌疑人1 嫌疑人2 嫌疑人3 嫌疑人4 嫌疑人5 嫌疑人6 325m Null 160m 400m Null 600m 2430m 890m Null 400m Null 280m 589m 5060m Null Null Null Null Null Null Null Null 3680m Null 表3:嫌疑人手机位置与案件发生地点的空间矢量矩阵 通过对表3的数据进行分析,可以初步判定嫌疑人1、嫌疑人2、嫌疑人3具有重大嫌疑。在实际操作中,单一种类轨迹构成的矩阵可能非常稀疏,往往需要将多种轨迹信息进行叠加分析,以提高分析的准确性。
4、用户界面:将数据挖掘通过可视化的方法展示给用户。
(1)数据挖掘过程具有高度的交互性,在涉及多维数据挖掘的过程中,要构建灵活的用户界面和探索式的挖掘环境。在串并案模板挖掘过程中,我们采用构建立方体(Cube)的方法,允许用户运用知识背景进行下钻、切片、维度旋转、设置度量等操作。
(2)数据挖掘结果展示采用可视化图形报表技术,具有用户友好界面,使得所发现的知识容易被理解。对于轨迹类信息的展示,采用GIS技术,将案件发生地点和嫌疑人活
12 / 14
动轨迹以散点形态展示在地图上。
图7:报表展示数据挖掘结果
图8:数据挖掘立方体
5、数据挖掘与隐私保护
数据挖掘对公民隐私的触及便不可避免。公安机关掌握
13 / 14
了大量公民个人隐私信息,侵犯公民个人隐私是从事犯罪情报分析工作不可规避的风险。从技术层面上讲,公安机关运用公民活动轨迹信息进行嫌疑人排查可以为侦查破案提供更加有效的支撑。但是,从保护隐私的角度来说,只可以使用嫌疑人员的活动轨迹进行挖掘。
14 / 14