大数据对当代经济和社会的影响 ——《大数据时代》读书感悟

发布时间 ¦ 2018-07-16 浏览次数 ¦

    作为去年最畅销的科技类书籍,《大数据时代》最能体现当代社会转型的特征,并因此开启了未来时的序幕。往往用时代这个词容易给人感觉到大言不惭,留下概念炒作的印象。但是当人们对时下科技的前沿有一定的了解,当读完全书之后方觉“大数据时代”这个概念绝非炒作,而是开启下一个时代的伟大转捩点,所以有人称大数据为未来学。该书的作者维克托·迈尔·舍恩伯格被誉为“大数据时代的预言家”,曾在哈佛大学、牛津大学、耶鲁大学和新加坡国立大学等多个互联网研究重镇任教。其早在2010年就在《经济学人》上发布了长达14页对大数据应用的前瞻性研究。该书正是这种研究著作。

一般阅读者总会对计算机科学的书籍抱有某种畏难情绪,总认为计算科学是一门过分重视数据、程序的学科,是一个令人望而生畏的学科,其作品肯定是晦涩如天书一般。但是环视全书,书中没有抽象的概念,也不需要任何编程技术的基础。该书虽然通俗易懂,但是着力分析了当代数据科学的基本思维方式,与其是本科普书籍,还不如说是一本专业书籍。它不仅仅是一本科普读物,也是一本预言式的读物。   

一、大数据时代的思维变革

一提起大数据,大部分人都停留在大数据的4个基本特征上,即数据体量巨大,数据类型多样,处理速度快,价值密度低。但是大数据的特征远远不止这一点,大数据有其思维方式,其对当代的产业起到颠覆性作用,对社会管理产生了强大的冲击。

从有限样本到总体样本

世界是丰富多样的,人类探求世界的努力是无止息的。很长一段时间以来,人们都希望通过将丰富的世界数据化,进而把握整个世界。在小数据时代,为了获得对世界的精确认识,研发了一系列细致而严谨地统计学方法。为了让分析变得简单,我们会把数据量缩减到最少,通过抽样,用一定的样本来代表大千世界,但是实际上这种抽样只是当时技术条件下的一种人为的限制。过去,因为记录、储存和分析数据的工具不够好,我们只能收集少量数据,这让我们一度很苦恼。

之所以要进行抽样分析,原因不外乎几点:一,收集数据的能力跟不上,没有找到更合适的搜集数据的方式;二,全体数据获取成本太高或者不现实,尤其是面对着动态的数据更是如此;三,资源限制,人们去分析世界所动用的分析工具有限,调动的资源有限;四,储存能力不足,即使搜集到那么多数据,也是无法存储;五,处理能力跟不上,退一步来讲,即使搜集到海量数据,更大的难题在于如何从这些庞大的杂乱的数据中找到有用的东西,要知道,多即是乱;六,应对能力跟不上,即使能分析到有用的东西,已经时过境迁;七,没有必要搜集海量数据,因为随机取样即使有误差,也能通过统计就能够得到比较满意的答案。所以,小数据时代,人们的思维方式限定了人们的工作方式,并且这种思维方式和工作方式之间形成了一个闭环,难以打破。直到大数据技术的出现,这种闭环才被撕破了一个口子。

当今技术发展越来越呈现出加速度的特征,并且已经具备强大的数据分析和整合能力。虽然人类可以处理的数据依然是有限的,但是我们可以处理的数据量已经大大地增加。目前机器处理能力有了巨大的提升的时代,小数据时代所面临的困难逐步被破解。

如今数字采集越来越简单,难度不断降低。各种传感器、搜索引擎、导航、网站点击都可以被轻而易举地记录下来,甚至人的每一个眨眼的动作都可以作为数据被记录下来。然而,采样一直有一个被我们广泛承认却又总有意避开的缺陷,现在这个缺陷越来越难以忽视了。以前我们所选取的样本,样本由于受到抽样思维方式的制约,样本的选择具有较大误导性。采样忽视了细节考察。虽然我们别无选择,只能利用采样分析法来进行考察,但是在很多领域,从收集部分数据到收集尽可能多的数据的转变已经发生了。如果可能的话,我们会收集所有的数据,即“样本 =总体”,而这正是大数据的基本思维方式。例如,人们对身体检查的思维方式也发生了全方位改变:过去的体检,抽血、测血压等各种方式,采取抽样方式检查。其弊端在于,测试当前的状况,而不是平时状况;测试样本的科学性不足;漏掉大量有用的健康信息,睡眠、吃饭、工作状态等。而大数据时代,将平时健康器材所搜集的所有数据都整合起来,导入医疗系统,从而展开交叉分析,得出这个人的精确信息。

由于大数据采集的是海量信息,它混杂了大量信息,所以它并不是精确的。在海量的数据中,大量的数据不像传统的统计学中的数据那么精确,而是有大量错误、杂乱的信息,况且有90%以上的非结构化信息。所以,这也造成大数据的悖论,一方面它是全方面、全方位的数据,另一方面,它是不精确、混杂的数据集合体。所以说,大数据是为了获得更广泛的数据而牺牲了精确性,也因此让我们看到了以前无法被关注到的细节。

因果关系转向相关关系

大数据是一种从因果关系转变为相关关系的转变。传统的研究方法重视因果关系,因果关系揭示了客观世界中普遍联系着的事物之间的关系,它们是先后相继、彼此制约的一对范畴。A事物引起B现象,那么说明AB的因,BA的果。这种思维方式简洁、方便,它是以人脑作为最基本的思维工具,通过概念、判断和推理来分析世界之间纷繁复杂的关系。

在大数据时代,人们通过大量复杂的算法摆脱了人脑的有限性瓶颈。机器思维被普遍地用来分析整个世界,思维方式也发生了翻天覆地的变化。由于机器能够搜集到海量的信息,它能够从海量的数据中挖掘事物和事物时间的关系。要从海量的数据中挖掘因果关系,是难中之难。但是海量数据中能够寻找到事物之间的关联性,这种关联性的蛛丝马迹为我们解开了世界的另一面神秘的面纱。

2004年沃尔玛对历史交易记录的数据库进行了分析,这个数据库记录的包括每一个顾客的购物清单、消费额、购物篮的物品、购买时间,甚至购买当日的天气。通过对这些海量数据进行分析,数据公司发现每当在季节性飓风来临之前,不仅手电筒销售量增加了,而且POP-Tarts蛋挞(美式含糖早餐零食)的销量也增加了。因此,当季节性风暴来临时,沃尔玛会把库存的蛋挞放在靠近飓风用品的位置,以方便行色匆匆的顾客挑选。结果这一招非常奏效,不但增加了手电筒的销量,而且增加了蛋挞的销量。

我们可以对大数据进行相关性分析,从而知道哪些事物之间有较强的相关性。大数据的相关关系分析法更准确、更快,而且不易受偏见的影响。大数据能够做到预测,能够根据现有的数据,发现所有人难以发现的蛛丝马迹。最终大数据做到分析过去事物之间的相关性,研判当下各种事物之间的联系,并且将过去和当下建立起联系,用来预测未来。

在本书中,作者将重点放在大数据的相关性关系上,忽视因果关系,有扬此以抑彼之嫌。大数据虽然重视相关性关系,但是相关性背后有某种原因,而且相关性信息不是反对因果关系,而是对因果关系的有效补充。海量的相关数据之间有某种因果关联。例如,美国人在飓风来临时买蛋挞,这是由于美国人的饮食结构、蛋挞能否存放等的原因而导致的。

二、大数据对经济的颠覆性变革

大数据由于具有较大的经济价值,所以首先被使用到经济领域。银行、证券、通讯等经济领域已经采用了大数据技术,在这些领域的商业模式正在悄然改变。

大数据对商业模式的改变

第一,大数据使企业真正以客户为中心。由于大数据能搜集所有的信息,所以它不需要通过样本群来代替全体样本。大数据能够使对企业的经营对象从对客户群的粗略归纳,转变成一个个活生生的客户。这样企业的经营就有针对性,对客户的服务就更好,投资效率就更高。

第二,大数据将颠覆企业的管理方式。在大数据时代,通过大数据的分析与挖掘,我们可以重构企业的管理方式。通过对大量的业务本身的分析,可以为决策提供必要的科学的手段。通过大量的数据分析,不必要依靠膨大的组织和复杂的流程,而是可以找到最合适,最有效的管理流程。

第三,大数据另外一个重大的作用是改变了商业逻辑。大数据可以在任何时候都可以搜索到答案,都可以用最省力的方法找到最佳答案。我们可能有全新的视角来发现新的商业机会和重构新的商业模式。在产品设计上,不用假设用户的习惯,而是直接就可以知道客户的习惯和偏好,设计能轻易命中客户的心窝;在营销上,我们知道客户喜欢什么、讨厌什么,营销更有针对性。

大数据能够不断产生创新价值

大数据的价值符合梅特卡夫定律的特点。梅特卡夫定律认为,一个网络的价值与联网的用户数的平方成正比,每位用户所获得的效益并非常数,而是大约随着网络用户总人数成线性成长。大数据中,数据越多产生的价值越高,况且这种价值是呈现几何指数增长的。大数据的价值主要有两个方面,其一是自有价值,在没有别的消费者使用的情况下,产品本身所具有的那部分价值;其二是协同价值,当新的用户加入网络时,老用户从中获得的价值。而目前大数据能在自由价值的基础上,产生源源不断的协同价值。亚马逊早期曾与aol达成协议,为其电子商务网站提供后代技术服务。在大多数人眼里,这只是一个普通的外包协议,而亚马逊真正的用意在于掌握用户的数据:他们在看什么、买什么。“这些数据可以帮助亚马逊提高它的推荐引擎性能。”聪明的亚马逊却知道如何从二次利用中获利。

数据的再利用价值对于那些收集或控制着大型数据集的机构来说是个好消息。那些线下运作的传统企业,他们或许正坐在尚未开发的信息喷泉上,但目前却很少使用。有些企业可能已经收集了数据并使用过一次,且因为存储成本低而将其保存了下来,但是它们不知道如何再次使用这些数据,数据科学家们称这类保存旧信息的计算机为“数据坟墓”。如今,在新的计算方式的推动下,这些数据会产生新的作用。

 不同于物质性资源,大数据的价值不会随着它的被使用而减少,而是具有边际效益递减的特征。这些已经用过的数据可以不断被处理,不断释放出新的价值。数据所有者可能借助传统的数据挖掘方法,实现大数据的第一次价值释放。然而,一些大数据分析公司,它们并不持有数据,可能通过重组数据和扩展数据,挖掘出二次乃至多次价值。所以,不同形式的数据搭配,可以取得不同的价值,从而从数据中源源不断地产生价值。

大数据数据成为生产要素

数据是典型的知识资产,也是轻资产。如果按照传统的评估方法,数据的价值是难以估算的。作者给我们举了一个例子,Facebook上市时总估值1040亿美元但是事实上Facebook公布的资产为66亿美元,包括计算机硬件、专利和其他实物价值。常规金融资产与其未记录的无形资产之间相差了近1000亿美元,差距几乎是20倍!数据库中存储的大量信息,这些才是数据的价值,除此之外Facebook几乎一文不值。未来,公司所持有和使用的数据将会是重要的价值。

在“大数据”时代,大数据分析为决策者进行企业级、全局性决策提供了支持。大数据所提供的信息资源已成为一种创造价值的新型生产要素,刺激企业生产流程的改造。大数据可以通过降低企业生产成本,提高企业生产效率,改变以往企业的粗放式管理,形成基于智能化管理的企业管理能力提升。大数据已经向那些线下大公司提出了挑战,人们必须意识到大数据的威力然后有策略地收集和使用数据。

大数据对传统行业的挑战已经引起了中国业界和政府的高度重视。2015年3月,全国两会上,全国人大代表马化腾提交了《关于以“互联网+”为驱动,推进我国经济社会创新发展的建议》的议案。他呼吁,我们需要持续以“互联网+”为驱动,鼓励产业创新、促进跨界融合、惠及社会民生,推动我国经济和社会的创新发展。201535日十二届全国人大三次会议上,李克强总理在政府工作报告中首次提出“互联网+”行动计划。今年“互联网+”成为最为吸引眼球的概念。互联网对数据使用有较为成熟的经验,这些企业已经成为大数据公司,他们的加盟必将推动企业向更快更好的方向发展,而跟不上步伐的企业,往往会被淘汰。

三、大数据将社会改革推向纵深度

当世界开始迈向大数据时代时,社会也将经历着一场持续的难以想象的革命。在改变人类基本的生活与思考方式的同时,大数据早已在推动人类信息管理准则上重新定位。

提升社会管理水平

“大数据”时代的数据技术革为决策支持系统带来了发展机遇,决策支持系统在系统定位、决策模式、数据处理、信息检索、系统安全等方面形成了新的发展趋势。

首先,有利于提高政府部门提高行政管理水平。一是有利于提升政府部门协同共享。大数据管理能力的提升,提高了政府各部门之间数据交换的能力,提升了协作水平。二是有利于提升管理决策水平。在政策制定阶段,数据分析是决定政策质量高低的关键性因素。经过大数据的分析,能够为政府决策提供更加客观、详实和可靠的数据,为决策提出参考。三是提高政府的执行力度和监管力度。在执行阶段,数据分析能够有效监控政策实施情况。政府部门越来越注重运用技术手段对数据资源进行深度的价值挖掘,满足日益增长的精细化、科学化管理需要。大数据是一种技术,更是一个支点,它有望能破解政府改革中的难题,能够啃掉改革的“硬骨头”,提升政府管理效能。

其次,有利于为市民提供日常生活服务。随着生活水平的不断提高,市民对包括气象、食品安全、交通等在内的生活资讯类信息愈发关注。大数据能够通过高效的分析手段,为市民提供相关信息,实现此类信息的公开,为市民提供更准确、及时、便利的日常生活服务。以公共卫生为例,大数据成为改变2009年甲型H1N1 流感的关键力量。大数据技术在当时能以最快发现流感传播的现状、范围和趋势,为政府和老百姓提供了及时准确的信息。而在传统的公共卫生管理领域中,一般要求医生在发现新型流感病例时告知疾病控制与预防中心。人们都会在发病多日后才选择医院就诊,从就诊到医院发出诊断预警信息,这其中约有一至两周的滞后周期。这也就直接导致流行疾病错过了最佳预警时期。在疾病高峰期,互联网上每分钟都会涌现出来自门户网站、博客以及其他网站等非官方来源的报告,速度远超官方机构对疑似病例的确认。

大数据带来安全的隐忧

大数据犹如一只无所不在的“第三只眼”,我们时刻都暴露在其监控之下。阿里巴巴正在监视着我们的购物习惯,百度正在监视着我们的网页浏览习惯,而微博、微信似乎什么都知道,不仅洞察了我们的生活,能够发掘到我们内心不为人知的隐私,甚至比我们自己还了解自己。大数据无论是在时间还是空间上,都能做到全方位监控。大数据的出现使得监视变得更容易、成本更低廉,也更有用处。大数据行业的所有使用者正在监视着我们的生活习惯。所以,作者发出了对大数据深深的隐忧:我们的隐私别人利用了,甚至发生多次利用,如果向他人公开我们的隐私,将会对个体造成毁灭性的影响。大数据公司正在通过多次使用我们的信息,为其产生源源不断的价值,而这些正是我们没有授权的,更是我们所不知道的。如果有一天造成大规模泄密,整个世界将会陷入一场灾难。

四、对大数据时代的反思

大数据虽然具有强大的功能,但是它为我们提供的不是最终答案,只是参考答案,而更好的方法和答案还在不久的未来。任何新技术的发展都经历了技术成熟度曲线的洗礼,形成了技术发展的几个特定阶段:认知期、过热期、冷却期、发展期和成熟期。在认知期,大家都在爬坡、认识该新技术;过热期,所有人一拥而上、参加讨论;冷却期,人们认为新技术不是万能的,对其热度开始下降;发展期,技术应用到商业运营的各个环节和生活的各个角落;成熟期,新技术成为我们生活中习以为常的一部分。

面对着这次大数据的技术革命,笔者认为我们要做到几个方方面:其一,高度重视大数据对未来的冲击,大数据是未来科学的趋势所在;其二,大数据正在改造我们的生活、学些和工作方式,这需要我们认真体会;其三,冷静观察评估大数据发展的阶段,根据实际需要,发展大数据产业的某一些环节,而不是全面铺开,合理使用大数据带给我们这个社会的价值;其四,循序渐进地发展大数据,依据现实需要,确定重点发展环节,以这些环节为突破点拥抱大数据所带来的冲击。

大数据技术是一个不断加速更新的技术,它不同于印刷革命,我们没有几个世纪的时间去适应大数据,也许只有几年,机遇稍纵即逝!


撰稿 ¦ 党西民 审核 ¦党校管理员 来源 ¦ 本站原创