第 2卷 .第 2期 0 21 0 0年 2月
计算机技术与发展C MPUTER O TECHNOL GY D AND DEVE【 PM[ D ENT
Vo . 0 No 2 12 . Fe . 2 1 b 0 0
基于模糊集的信息检索方法汪小珍,,李龙澍 一, 2(. 1安徽大学计算智能与信号处理教育部重点实验室,安徽合肥 2 03; 309 2安徽大学计算机科学与技术学院, .安徽合肥 2 03 ) 309摘要:糊集理论是一种处理含糊和不确定性问题的数据分析方法,模以其为理论基础的数据处理技术得到深刻关注和
不断发展。信息检索致力于寻求准确、高效、智能的信息组织与存取方法,成为当今智能信息处理领域的重要研究内容。文档的信息检索过程实际上涉及文档集的表示、查询的表示、似性匹配及其排序三部分,中利用了模糊集理论中用户相文
的模糊集合问中的包含关系——包含度定理,利用其中的“包含”关系体现了文档集和用户查询之间的匹配,给出一种信息检索方法,用其包含度实现检索结果文档集的排序。并 关键词:息检索;集;信模糊包含度中图分类号: P 9 . T 313文献标识码: A文章编号:63 2X 2 1 )2 0 3— 3 17—69 (000— 07 0
An I o m a in t iv lS he eBa e n z y S t nf r to Re re a c m s d o Fu z eW ANG a _h n,, o gs u, Xioz e 12 LIL n—h
( . ns y f d . e a .o tlgn o uig& Sga Poe i n u nv, e2 0 3, h a 1 Miir u K yL b f neiet mp t t oE I l C n i l rcs n a A h i i.Hd i 30 9 C i; n s g t U n 2 Sh o o o p tr c c dT cn l yA h i nv, ee2 0 3, h a .col C m ue i ea eh o g, n u U i.H f 30 9 C i ) f Se n n o i n
Ab ta tFu z t h oyi ido aaa ayi to od a t g e e a du crany. rpdgo ho neetcnb t src: zys e r akn f t n lssmeh dt el hⅥIu n n n eti t
A a i rwt fitrs a el dy et s d wi a
s∞ i zysth r di #i t m. a igu t rain dacsi fr t nrsu pei l,f cie ditl e nf z ey a s p e i T kn p hog z a ces i omai o艄 rc e ef t la ei u e to n t a a o n i n g g n n o e s y e v y n n l—g nt i o ̄t nrtiv l a e n b crag c re trsa c os o fitlg n n omain po esn Th no main r tiv l e l nfm i ere a sb e eonn u rn eerh h tp to nel e ti r t r csig. e ifr t erea y. o h i f o o po esidu e h e a t: w t x r s h o t e t, w t x rs h u re, w t ma eted cma t n d q eismac rcs n dst rep rs Ho oe p ested cman Ho oe p esteq eis H s O o k h o t e sa u re n th frt ep rx o er vla drn t ers1I t sp p r an w ifr t nrtivlsh mei e in d u i f zy stk o o h ut ̄ frti a n a k h e u.n hi a e, e no ma i erea c e e o sd s e s g g n uz e n wlte rm o n ld e re uei oma et ed c me t n d q e i h e o ficu ed g e,s tt k h o u n sa u re smac as s h nl ed ge orn t o . e t whc r th,louet eicu e ret a k hed omqn d s ih e tiv d. re e Ke I:no main rtiv;uz e;n d gre yWO ̄ i r t re a fzy stidu ede e I f o e l
0引言大规模数据库的广泛使用和网络的高速发展,导致信息资源数量的急剧增长,而丰富信息的巨大价然值并没有得到充分体现,人们面对的是一个无序的信息世界,有价值和无价值的信息相互混杂,如何从这些信息中发掘出真正需要的信息成为当今世界人们面临的一个普遍难题,这就需要研究新的技
术手段组织、整
学与技术学科的一个研究热点l。传统的信息检索模 l J型包括布尔模型、向量空间模型和概率模型 J。布尔
模型中文档与查询的匹配过于严格,对检索词的重要程度无法区分,法进行检索结果的排序。文中提出无一
种基于模糊集的信息检索方法,能够解决文档与查
询过于严格的匹配问题,对检索词的重要程度有了定量的度量,并能够对检索结果排序。
理和存取海量信息。致力于寻求准确、高效、智能的信息组织与存取方法,息检索由此成为当前计算机科信收稿日期:0 9 6 6修回日期:0 9一O一l 2 0一O—2; 20 9 7
模糊集理论是美国计算机与控制论专家 L A. . Zdh 16 ae于 95年提出来的 J为处理不确定性问题提,供了有力的工具和方法。模糊集理论在很多领域得到了成功的运用,如对模糊集理论的拓展而形成的新的
基金项目:国家自然科学基金项目(0 70 3; 6 2 3 4 )安徽省高校拔尖人才基金项目( 5 2 1 2; 00 5 0 )安徽省自然科学基金项目( 5 40 0 )安 0 0 2 24;徽省教育厅自然科学研究基金项目(0 6 08 2 0 KJ9B)
概念模型 L、 4在信息检索上的应用 -等。 J 5 J
作者简介:汪小珍 ( 94,, 18一)女硕士研究生,究方向为不精确信研息处理、息检索;龙澍,信李教授,博士生导师,究方向为智能软研
1模糊集的相关概念定义 1论域 U上的一个模糊集合A是由U上的 一
件、知识工程、软件体系结构。
个隶属函数 A: U一[,] 0 1来表示,其中 A( )有时 z(