大数据的介绍及案例分享(2)

2019-08-17 13:31

向其他国家卖他的产品,老了以后他把公司卖给了他的一个主管,成了成立IBM的三家公司之一。

但是,将穿孔卡片作为收集处理大数据的方法依然过于昂贵。毕竟,每个美国人都必须填一张可制成穿孔卡片的表格,然后再进行统计。这还是非常麻烦的。

70万家企业联网“直报”统计数据

我们知道国家统计局每年都要编写的《中国统计年鉴》。

和美国一样,以前我们国家统计数据,是层层上报,人工统计,比如,国家进行人口普查,是县级——市级——省级——国家这样层层上报人口数据,这样得到的数据往往滞后,很不准确。

从2012年2月18日开始,全国70万家\三上\企业和房地产开发经营企业在统一的数据采集和处理平台上,通过互联网直接向国家数据中心或国家认定的省级数据中心报送统计数据。这样就保证了数据的准确性,及时性。

2013年11月19日下午,阿里巴巴、百度、中国联通等11家涉足大数据的领军企业代表与国家统计局签署关于大数据的战略合作协议,共同探讨和推进大数据在政府统计中的应用。

战略合作内容,主要是共同研究探讨建立大数据应用的统计标准,包括指标定义、口径、范围、分类等;确定利用企业数据完善、补充政府统计数据的内容、形式及实施步骤,包括数据采集、处理、分析、挖掘、发布等。在此基础上,合作双方将建立战略合作关系。

政府统计部门收集的数据来源更广更多,有各个部门的行政记录,有电商企

业的数据,有包括搜索记录、社交记录和媒体等互联网数据。

电子政务:通过政府信息化,大数据能够提高政府决策的科学性和精准性,提高政府预测预警能力以及应急响应能力,节约决策的成本。以财政部门为例,基于云计算、大数据技术,财政部门可以按需掌握各个部门的数据,并对数据进行分析,做出的决策可以更准确、更高效。另外,也可以依据数据推动财政创新,使财政工作更有效率、更加开放、更加透明。

麻省理工与通货紧缩预测软件

“10亿价格项目”(The Billion Prices Project,BBP)提供了一个有趣的例子。美国劳工统计局的人员每个月都要公布消费物价指数(CPI),这是用来测试通货膨胀率的。这些数据对投资者和商家都非常重要。在决定是否增减银行利率的时候,美联储也会考虑消费指数。一旦发生通货膨胀,工人工资也会增加。联邦政府在支付社会福利和债券利息的款项时,这项指数也是他们参考的依据。

联邦政府为了得到这些数据,会雇用很多人向全美90个城市的商店、办公室打电话、发传真甚至登门拜访。他们反馈回来的各种各样的价格信息达80000种,包括土豆的价格、出租车的票价等。政府采集这些数据每年大概需要花费两亿五千万美元。这些数据是精确的也是有序的,但是这个采集结果的公布会有几周的滞后。2008年的经济危机表明,这个滞后是致命的。政策决策者为了更好地应对变化,需要及时了解通货膨胀率,但如果以传统的依赖采样和追求精确的方式进行数据收集,政府就不可能及时获得数据了。

麻省理工学院(MIT)的两位经济学家,阿尔贝托·卡瓦略(Alberto Cavell)和罗伯托·里哥本(ObertoRigobon)就对此提出了一个大数据方案,那就是接受

更混乱的数据。通过一个软件在互联网上收集信息,他们每天可以收集到50万种商品的价格。收集到的数据很混乱,也不是所有数据都能轻易进行比较。但是把大数据和好的分析法相结合,这个项目在2008年9月雷曼兄弟破产之后马上就发现了通货紧缩趋势,然而那些依赖官方数据的人直到11月份才知道这个情况。

沃尔玛

沃尔玛零售巨头是最早在零售业运用大数据的,因而改变了整个行业。沃尔玛通过大数据提前预知顾客明天会做什么,并提前准备。这就是人习惯性的力量通过大数据总结汇总分析出的。

沃尔玛有一个经典的案例,那就是:啤酒和尿布的例子,这个例子大家都知道,现在看看沃尔玛另外两个例子:

请把蛋挞与飓风用品摆在一起

依据是注意到2004年沃尔玛对历史交易记录这个庞大数据库进行观察,这个数据库记录的不仅包括每一个顾客的购物清单以及消费额,还包括购物篮中的物品,具体购买时间,甚至购买当日的天气。

通过大数据,沃尔玛注意到,每当季节性飓风来临之前,不仅手电筒销量增加,而且美式早餐含糖零食蛋挞销量也增加了,因此每当季节性飓风来临时,按前面摆放在一起,以方便行色匆匆的顾客,从而增加销量。

东海岸——中海岸——西海岸

在美国,东海岸与中海岸时差两小时,东海岸的沃尔玛超市早上开门营业两

小时之后,这时候中海岸才开始营业,沃尔玛就会把东海岸当天这两小时的营业情况、相关数据传给中海岸,中海岸就会根据这个数据知道了这天人们的购买喜好,决定货品怎么摆放,哪些货物摆放在一起会比较好,然后等中海岸的沃尔玛营业两小时之后,西海岸才到早上,才开始营业,同样,把东海岸和中海岸的营业数据传到西海岸。这种方式给沃尔玛带来了很大的利润。

美国折扣零售商塔吉特与怀孕预测

大数据运用的极致,非美国折扣零售商塔吉特莫属了。《纽约时报》曾报道过塔吉特公司怎样在不被清楚告知的情况下预测出一个女性的怀孕情况。很多人都不知道,对于零售商来说,知道一个顾客是否怀孕非常重要。因为这是一对夫妻改变消费观念的开始,也是一对夫妻生命的分水岭。他们会开始光顾以前不会去的商店,渐渐对新的品牌建立忠诚。

塔吉特的分析团队首先查看了签署婴儿礼物登记簿的女性的消费记录。他们注意到,登记簿上的妇女会在怀孕大概第三个月的时候买很多无香乳液。几个月之后,她们会买一些营养品,比如镁、钙、锌。公司最终找出了大概20多种关联物,这些关联物可以给顾客进行“怀孕趋势”评分。这些数据甚至使得零售商能够比较准确地预测预产期,这样就能够在孕期的每个阶段给客户寄送相应的优惠券。

杜西格在《习惯的力量》(The Power of Habit)一书中讲到了接下来发生的事情。一天,一个男人冲进了一家位于明尼阿波利斯市郊的塔吉特商店,要求经理出来见他。他气愤地说:“我女儿还是高中生,你们却给她邮寄婴儿服和婴儿床的优惠券,你们是在鼓励她怀孕吗?”而当几天后,经理打电话向这个男人致歉

时,这个男人的语气变得平和起来。他说:“我跟我的女儿谈过了,她的预产期是8月份,是我完全没有意识到这个事情的发生,应该说抱歉的人是我。”

在社会环境下寻找关联物只是大数据分析法采取的一种方式。同样有用的一种方法是,通过找出新种类数据之间的相互联系来解决日常需要。比方说,一种称为预测分析法的方法就被广泛地应用于商业领域,它可以预测事件的发生。这可以指一个能发现可能的流行歌曲的算法系统——音乐界广泛采用这种方法来确保它们看好的歌曲真的会流行;也可以指那些用来防止机器失效和建筑倒塌的方法。现在,在机器、发动机和桥梁等基础设施上放置传感器变得越来越平常了,这些传感器被用来记录散发的热量、振幅、承压和发出的声音等。

一个东西要出故障,不会是瞬间的,而是慢慢地出问题的。通过收集所有的数据,我们可以预先捕捉到事物要出故障的信号,比方说发动机的嗡嗡声、引擎过热都说明它们可能要出故障了。系统把这些异常情况与正常情况进行对比,就会知道什么地方出了毛病。通过尽早地发现异常,系统可以提醒我们在故障之前更换零件或者修复问题。通过找出一个关联物并监控它,我们就能预测未来。

Hitwise,通过流量判断消费者喜好

数据创新再利用的一个典型例子是搜索关键词。消费者和搜索引擎之间的瞬时交互形成了一个网站和广告的列表,实现了那一刻的特定功能。乍看起来,这些信息在实现了基本用途之后似乎变得一文不值。但是,以往的查询也可以变得非常有价值。有的公司,如数据代理益百利旗下的网页流量测量公司Hitwise,让客户采集搜索流量来揭示消费者的喜好。通过Hitwise营销人员可以了解到粉红色是否会成为今夏的潮流色,或者黑色是否会回归潮流。谷歌整理了一个版本


大数据的介绍及案例分享(2).doc 将本文的Word文档下载到电脑 下载失败或者文档不完整,请联系客服人员解决!

下一篇:aa机械工业部关于下达机械工业从事高温、高空、有害、特别繁重劳

相关阅读
本类排行
× 注册会员免费下载(下载后可以自由复制和排版)

马上注册会员

注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信: QQ: