北京交通大学专业硕士学位论文参考文献
5 基于大数据技术的电子商务个性化推荐系统设计与实现
本节对基于大数据技术的电子商务个性化推荐系统进行设计和实现,具体内容包括系统功能需求分析、功能设计、详细设计、应用技术概述等。
5.1 个性化系统功能需求分析
电子商务推荐系统主要的目的是在用户购买产品的时候提供用户个性化信息,帮助用户购买过程中做出决策,是面向用户的系统。推荐系统的一个显著特点是,能够收集用户的兴趣资料,并且根据用户兴趣偏好主动为用户做出个性化推荐,并且能够实时更新推荐,方便用户,提高企业的服务水平。供应链决策支持系统、企业营销系统和电子商务推荐系统不同。供应链决策支持系统为生产者提供决定生产规模、时间和储量的参考信息,而企业营销系统目的则是为了帮助企业在销售产品时做得更好。总体上来说,电子商务个性化推荐系统一般需要满足如下需求:
? 需要解决如何获取用户相关信息。推荐系统推荐的基础是用户的兴趣资料
信息,个性化推荐系统获得越多的用户信息,为用户提供的个性化推荐就越准确。
? 电子商务个性化推荐的算法需要满足一定的准确率和效率。
? 针对个性化推荐系统需要能做出综合的客观的评价。从用户满意度、准确
率、个性化、安全性等方面进行综合评价分析。
? 电子商务推荐系统需要提供个性化的购物环境,更好的提供网络用户关系
管理信息和企业销售决策。
? 个性化建议。根据用户的不同兴趣类型,针对其个性化的需求,掌握其不
同的兴趣,并针对特定的兴趣给出特定的建议。
? 提高对个性化推荐的自动化功能。目前一般的推荐技术下,用户需要逐步
的搜索,逐步输入需求的关键词才能获得相关信息,自动化程度比较低,程序繁琐。
? 提高持久性程度。目前的推荐一般都只基于用户当前登录后的操作得到的
信息,没有能力收集用户以前的历史信息和历史兴趣偏好。
26
北京交通大学专业硕士学位论文参考文献
5.2 个性化推荐系统功能设计
基于以上分析,该系统需要三个核心功能模块来支持:输入功能、推荐算法和输出功能:
1、 输入功能模块。在此功能模块中,由于不同的系统面对不同需求的用户,
所以不同的系统输入信息各异,可以根据输入信息过程中的目标群的群类区别进行划分,可划分成两种类别:个人用户和社团群体用户两种。个人用户在系统中的输入的信息包含:用户购买历史、隐式关键词输入、显式浏览输入、项目属性输入、浏览内容的输入等等,从这些信息中提取他们表达出来的偏好并对某些项目进行评价。社团群体输入是指集体形式的评价数据,其中包含评分、项目属性、社团购买历史、文本评价等。 2、 推荐算法模块。推荐算法是整个系统的核心,算法的优劣对系统的性能起
决定性作用。针对推荐算法系统对实时性和数据准确性的高要求,以产生定位精确有效的推荐,在推荐算法中运用了人机交互领域以及数据挖掘领域的一些最新研究成果。如图5-1所示。
图5-1推荐算法
Fig.5-1 Recommendation Algorithm
User-based协同过滤推荐算法Item-based协同过滤推荐算法Horting图 推荐算法Clustering协同过滤推荐算法基于Baysesian网络推荐基于规则推荐算法机器学习分类问题Memory-based协同过滤算法推荐算法Model-based协同过滤算法3、 输出功能模块。该模块是在用户输入信息后,通过推荐算法的计算过滤处
理,将得出的结果即合理的推荐内容展示给用户。该模块支持四类形式的输出:第一类为建议:主要分为单个建议、排序建议列表和未排序建议列表。第二类为预测:个性化推荐系统根据算法运算处理,为项目给出一定的综合推荐分数,然后根据分数进行排序,优先推荐分数高的项目。第三类为个体评分:推荐系统支持用户对商品进行评分,然后根据用户的评分进行排序推荐。第四类为评论:推荐系统抓取其他用户对商品的文本评价信息,过滤筛选之后进行推荐。
基于以上核心功能模块,个性化推荐系统的详细功能设计如图5-2所示。
27
北京交通大学专业硕士学位论文参考文献
用户交互模块在线收集用户反馈推荐结果封装推荐结果处理模块推荐结果过滤推荐结果排序推荐结果解释系统管理模块推荐引擎组管理离线推荐在线推荐推荐引擎管理系统参数配置数据收集模块网站数据收集数据提供接口日志数据收集用户网站行为数据收集系统数据查看
图5-2基于大数据技术的电子商务个性化推荐系统功能架构图
Fig.5-2 E-commerce personalized recommendation system based on big data technology
如图5-2所示,基于大数据技术的电子商务个性化推荐系统的功能架构分为五大部分,分别为:数据收集模块、推荐引擎组管理、推荐结果处理模块、用户交互模块、系统管理模块。
5.2.1 数据收集模块
数据提供接口:数据提供借款是系统向不同推荐引擎提供数据的接口功能,实现了根据不用推荐引擎可以提供满足该引擎的数据的接口功能。
网站数据收集:网站数据收集是系统收集来自电子商务网站的用户数据和商品数据的收集功能。
日志数据收集:日志数据收集是系统收集系统日志中提取的用户行为数据。 用户网站行为数据收集:用户网站行为数据收集是系统收集用户在网站的直接行为的收集功能。
5.2.2 推荐引擎组管理
28
北京交通大学专业硕士学位论文参考文献
离线推荐引擎:离线推荐引擎是系统提供使用离线推荐引擎进行推荐算法的功能。
在线推荐引擎:在线推荐引擎是系统提供使用在线推荐引擎进行推荐算法的功能。
推荐引擎组管理:推荐引擎组管理是系统提供根据不同用户制定不同推荐引擎,并进行推荐的功能。
5.2.3 推荐结果处理模块
推荐结果过滤:推荐结果过滤是系统提供根据用户信息对推荐结果进行过滤的功能。
推荐结果排序:推荐结果过滤是系统提供根据用户信息对推荐结果进行排序的功能。
推荐结果解释:推荐结果过滤是系统提供根据用户信息对推荐结果进行解释的功能。
5.2.4 用户交互模块
在线收集:在线收集是系统提供收集用户使用系统的信息的功能。 用户反馈:用户反馈是系统提供用户向系统发送反馈信息的功能。
推荐结果封装:推荐结果封装是系统向上层系统提供推荐结果时对推荐结果进行封装的功能。
5.2.5 系统管理模块
系统参数配置:系统参数配置是系统提供对系统运行参数的配置功能。 系统数据浏览:系统数据浏览时系统提供对系统运行参数和状态的浏览的功能。
5.3 个性化推荐系统详细设计
本节根据前一节基于大数据技术的电子商务个性化推荐系统的功能设计,对其中的一些业务进行详细的业务设计以及数据库设计,给出系统的关键类设计和数据库核心表的设计。
29
北京交通大学专业硕士学位论文参考文献
结合5.2节的系统功能设计,系统的关键业务类分为十五大组,分别为:网站数据收集、日志数据收集、用户网站行为数据收集、数据提供接口、离线推荐管理、在线推荐管理、推荐引擎管理、推荐结果过滤、推荐结果排序、推荐结果解释、在线收集用户交互界面、用户反馈交互界面资源管理、推荐结果封装、系统参数配置、系统数据查看,每个组包含了若干的关键业务类。具体的业务类及类与类之间的关系如图5-3所示。
RecommendPackage+package()1RecommendServer+recommend()RecommendInterpretation+interpretation()1RecommendSortSysConfig+config()RecommendFilter1+sort()+filter()1SysDataView+view()1DataProvider+provider()11dataModel111DataCollectionInterface+collect()DataCollectionWebsite+collect()DataCollectionLog+collect()DataCollectionBehavior+collect()
图5-3类关系图 Fig.5-3 Class Diagram
系统是由数据类:dataModel;数据采集类:DataCollecttionInterface、DataCollectionWebsite、DataCollectionLog、DataCollectionBehavior、DataProvider;数据推荐类:RecommendServer、RecommendFilter、RecommendSort、RecommendInterpretation、RecommendPackage;系统管理类:SysConfig、SysDataView组成。
DataModel是数据采集模型,用来在计算机中表示采集的数据对象。 DataCollecttionInterface是数据采集接口,用来在计算机中表示一个抽象的采
30