基于分类技术的Blog用户兴趣挖掘(2)
2012-08-21 20:38
通过分析,笔者认为可以采用速度较快的中心向量法和准确性很高的kNN算法相结合的方式完成博客文章的分类。系统先采用中心向量法进行分类,对于超过预定义边界范围的待分类向量再采用kNN算法进行补充分类,以保证其分类准确性。因为在大多数情况下,中心向量法即可完成分类,所以该方式显著减少了分类算法的平均计算时间。
3.3 构建兴趣集合
当一个博客的所有文章被分类后,文章所属的兴趣类别被认为是博客作者的兴趣。然后,对兴趣进行整理和排序:根据每个兴趣出现的次数对兴趣进行排序,以兴趣出现次数的多少反应博客作者对兴趣感兴趣的程度。不同层次的兴趣单独计算。
用户兴趣的收集和挖掘可能会涉及到用户的隐私和安全问题,因此,在使用用户兴趣数据前要征得用户的同意,同时让用户积极参与,以获得更好的用户个性化服务。
4 Blog用户兴趣挖掘的应用
4.1 自动推荐相似兴趣的博客
对于给定的博客,利用推荐系统可以挖掘出博客用户的兴趣,然后在索引的数据中选择与这些兴趣最匹配的博客。这样,不仅可以帮助用户迅速地了解博客的整体内容,同时兴趣相似的博客的推荐可以让用户找到更多相关的信息,也有助于社会化网络的构建。
4.2 提供个性化的搜索与浏览博客空间中的内容的服务
可以使用个性化搜索引擎索引博客或博客文章,以及博客文章的兴趣类别,博客用户的兴趣和博客关键词,方便用户在博客空间中快速地定位和浏览感兴趣的博客或博客文章。
5 结束语
综上所述,由于Blog提供了更为丰富、极具个性化的信息资源,使得用户主动寻找和发掘自己感兴趣的Blog,而通过基于文本分类技术的Blog用户兴趣挖掘方法,可以满足用户的需求,并且可以为用户提供个性化的信息服务。
参考文献:
[1]崔琳,汪材印.Blog的核心技术和Web挖掘[J].电脑开发与应用,2008,2:44-45,48
[2]中国互联网络信息中心(CNNIC).中国互联网络发展状况统计报告.2009
[3]杨宇航,赵铁军,于浩,郑德权.Blog研究[J].软件学报,2008,4:912-924.
[4]石伟志,刘 涛,吴功宜.一种快速高效的文本分类方法[J]. 计算机工程与应用,2005,41(29):180-183.
[5]柯慧燕.Web文本分类研究及应用[D].硕士学位论文.武汉理工大学,2006
基于分类技术的Blog用户兴趣挖掘(2).doc
将本文的Word文档下载到电脑
下载失败或者文档不完整,请联系客服人员解决!