第1章 课题研究背景与价值
第1.1节 选题的意义与价值
1.1.1 理论价值与意义
现如今,何事物都必须用数据来说话。面对互联网上海量的数据信息,我们呢难以想象通过人工来挑取其中对我们有用的数据。那问题就来了,结合网络信息采集技术和信息文本处理等技术研发一个用户有用的舆情系统是有必要的,它将我们帮助我们在互联网大量数据中。快速的筛选出对自己有利的信息进行分析。它将免去我们面对互联网海量数据的困扰。
伴随着互联网信息时代的来到,我们通过在互联网进行数据的采编与处理,可以准确过滤掉对自己没有用的垃圾信息,并通过我们对各大购物网站的信息采集,来判断行业的趋势,免去我们在铺天盖地的大数据中迷失方向。我们可以及时的搜集到准确有用的信息,把我们的时间消损失降到最低。
1.1.2 实践价值与意义
互联网先如今已经发展成为当今世界上最大的信息库,中国网民人数,全球规模第一。互联网是网民最快最新发布与获取信息的渠道之一,越来越多的信息都是通过互联网散发的,对于其影响力不容小视。根据中国互联网络信息中心(CNNIC)的统计,中国网民规模达到5.13亿,互联网普及率攀升至43.3%,其中20岁以上网民占80%。随着网络在全球范围的快速发展,网络媒体已逐步被公众认可。
关于手机,中新社上海2月19日某知名信息技术顾问和研究公司19日发布报告称,2015年全球智能手机销量达14亿部,较2014年增长超过14%。看到如此高的成交量,难道这是巧合。有供求关系才可能达到那么高的交易量,从而那并不是巧合。现在手机行业迅速发展,竞争激烈。对于我们来说也是一个好消息,有竞争才能够让用户的到更多的实惠,那么面对这么多的手机厂商的产品,那我们应该如何面对与抉择呢。据不完全统计,消费者在购买手机前的信息搜集来源:40%信息来着亲朋好友,25%信息来源于实体店体验,45%信息来源于电视广告、网络。可见网络信息也是同样影响消费者选择产品的重要力量。所以每天都有海
2
量的文章每天在互联网上传播,时刻影响着消费者的选择结果。那么做一个针对专一行业的舆情系统是很有必要的[11]。
第1.2节 研究综述
1.2.1 国内研究
根据舆情分析发展来说,国外研究比较早。自19世纪中期初级发展,到20世纪中期已经逐渐成熟。我国舆情研究主要起步于20世纪末,到党的十六届四中全会后,舆情研究与实践迎来高潮。虽然我国舆情研究落后于外国,但我们不怕落后,奋起直追国内的舆情研究也渐渐向世界最前沿靠拢。我国在研究方面,主要是根据政府的舆情信息进展的,研究层次相对于外国来说,深度达不到。
就个人观点来看,现在国内舆情的研究存还存在许多的缺口。比如现在国内对于舆情研究主要服务于政府和少数的企业。研究和实践范围太过于单一,然而我认为应该应用于多方面,才能真正的对舆情研究达到一个新的高度。对于服务人群来说,应该每个人都有享受服务的权利。
1.2.1 国外研究
国外的舆情研究主要是民意调查以及媒体舆论相关方面的,尤其是研究关于民意调查,国外已经对民意调查形成了一个相对完整的理论,并且有一个完成正的应用体系。另外,国内外文化差异和社会形态影响。国内的舆情开展主要是服务于政府,而国外与国内不同,国外则除了服务政府之后还涉及社会经济、社会文化。
就个人观点来看,国外的舆情研究比国内研究起步就早,国外的舆情研究多元化,是舆情研究发展的好现象。
第1.3节 课题的研究意义与目的
1.3.1 理论意义
正如上文提到,网络信息已经是消费者选择手机产品的有力影响力之一。那将会花掉我们大量的时间去网上查资料,并花大量的时间来阅读,然到最后发现并没有找到我们想要找的信息。然而最大的痛苦莫过于此,我们花费了时间,花
3
费了精力,还没有得到自己想要的数据或者文章。这也是互联网海量数据带来的困扰。
面对互联网上海量的数据信息,我们难以想象通过人工来挑取其中对我们有用的数据。那问题就来了,结合网络信息采集技术和信息文本处理等技术研发一个用户有用的舆情系统是有必要的,它将我们帮助我们在互联网大量数据中快速的筛选出对自己有利的信息进行分析。它也将免去我们面对互联网海量数据的困扰。从而改变我们对互联网大数据时代的进一步了解并利用。
1.3.2 实践意义
那么对于消费者来说有价值的数据就是购买力,那么什么叫有价值的数据呢。首先,你要保证真实性,任何不真实的数据都是在欺骗消费者;然后还要保证时效性。所以一定要保证数据的真实时效性。
通过在互联网进行数据的采编与处理,可以准确过滤掉对自己没有用的垃圾信息,并通过我们对各大购物网站的信息采集,来判断行业的趋势,免去我们在铺天盖地的大数据中迷失方向。我们可以及时的搜集到准确有用的信息,把我们的时间消损失降到最低。国内关于,互联网信息采集技术已经愈发的成熟。实现关于手机舆情系统的信息抓取已经没有问题,再加上处理信息的技术逻辑比较简单,技术上的完全可以实现。
现在国内的舆情报告大多数则是针对企业用户而设计的,完全针对个人用户的寥寥无几,所以这种针对个人用户和专一行业的舆情系统几乎完全空白。
第1.4节 研究范围与内容
1.4.1 舆情定义
舆情是“舆论情况”的简称,是指现实生活中,人们围绕现实生活中发生的某一件事为话题,这个事件可以是国际大事件,也可以是生活中的小事。然而大量网友通过网络针对某个话题自己的想法和立场的品论。从中体现出网友关于社会中的某种现象或者社会中存在的某些问题表述自己表达出自己的信念、态度和意见等等,从而产生的一种社会态度。它是有较多群众关于这种社会态度的综合表现。
4
那么通过什么方式来了解舆论情况的呢,说明白就是对网上的一些数据进行抓取总汇并进行分析,从而得出舆论情况。
1.4.2 研究观点
这是一个信息时代,在这个数据漫天飞的信息时代。人们应该何去何从,该如何享用信息时代带给我们的好处。每天都有海量的数据铺天盖地,那又该如何在其中选择自己想要的数据。每天都会被网上的垃圾信息搞的心烦意乱,又该怎么面对。
个人认为舆情系统不应该只是服务于政府、企业。更应该开放于大众的用户,因为大众也应该有同样的权利享用信息时代带给我们的好处。我们不应该再在这个时代迷茫了。面对这么多的中国网民被铺天盖地信息困扰,是否早就应该得到重视。是时候,给广大中国网民定制一个应用于广大群众的舆情系统了。
第1.5节 研究视角与方法
1.5.1 研究视角与思路
在技术方面,现在的数据抓取技术已逐渐走向更智能的路线。现有的技术也已经逐步发展成熟,支持本系统的数据抓取和挖掘已经足够了。作为数据的挖掘者,我很清楚,大数据的抓取和分析一般都是服务于国家或者企业用户的。然而现在如今也存在大部分人,根本不理解数据分析的概念,导致针对个人用户的舆情分析难以推广。人工智能是以后发展的方向。人们还特别关注人工智能,我相信,还有很多人根本不了解,其实人工智能就是大数据分析的结果。所以我呼吁所有人,开始重视数据吧,举个最实用的例子,上法庭就是讲究的证据。法庭上的证据就是相当于我们现在所分析的数据。大数据时代已经大步迈来,是要选择做一只迷路的小绵羊,还是要选择做一只在狂风暴雨中捕捉事物的狼。
相信大多数人们还都为面对大量数据该怎么选择性接受而苦恼,还有部分极端的直接抛弃如此大量的数据,来用自己独特的方式来搜集数据。然而这就大错特错了,本来选择性的相信是正确的理解态度,但完全的不理睬则是很不理性的做法。
1.5.2 研究方法
5
(1)文献资料整理法
通过整理归纳文献资料,来收集国内舆情网站的相关知识,其中也包含网页界面设计相关理论和设计案例。
(2)案例研究比较分析法
通过国内外对舆情网站的布局设计和功能实现,总结出各个产品界面的优劣,实现自己的产品设计。
(3)多科学综合研究法
在自己的设计过程中涉及到的相关科学领域,如美学、设计学、心里学等放在一个设计平台上综合研究。为全面的、系统的设计出舆情网站打下良好的理论基础。
6