交行统一搜索复合排序和分类导航

2020-12-16 10:13

交行统一搜索复合排序和分类导航

交行统一搜索

--复合排序,分类导航 复合排序

排序算法如下:

1) 选取匹配度最高的100条文档,每个文档的匹配度为P(0-1的小数)

2) 每个文档有一个地域属性D,按分行划分,本行的文档D=1.2,总行的文档D=1.1(如果这个人是总行,文档也是总行,两个条件均符合,则取最大值D=1.2),其他行的文档D=1(如果应用系统如内网不能提供文档所属分行,一律按空白处理,这一类文档权重跟其他行的一样)

3) 新鲜度F:文档新鲜天数days = 系统当前时间 - 文档更新时间(新创建的文档取文档创建时间,流转中文档取最新更新时间,不是指索引创建时间),如果新鲜天数days <=30天,则F=1.2;30<days<=60,则F=1.1;days>60,则F=1;如果无法获取文档更新时间,F=1。

4) 应用A:根据文档来源的应用系统,得到不同的系数 OA公文 A:1.2

内网 A:1

邮件 A:1.1

外部资讯 A:1

论坛 A:1

档案 A:1.2

总的相关度R=匹配度P * 地域D * 新鲜度F * 应用A

按相关度R从大到小依次排序,R越大的文档越靠前。

在总的相关度R都计算完后,调用(参看SimpleSearch.java277至297行) Collections.sort(list,new ComparatorMap());

排序算法要求如下:

索引库有以下字段数据:

CreateDate:文档更新时间

AppID:文档所属应用

AreaID:文档所属地域


交行统一搜索复合排序和分类导航.doc 将本文的Word文档下载到电脑 下载失败或者文档不完整,请联系客服人员解决!

下一篇:C语言数组基础知识讲解

相关阅读
本类排行
× 注册会员免费下载(下载后可以自由复制和排版)

马上注册会员

注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信: QQ: