拥抱“大数据”加快城市转型创新
李克强总理在今年政府工作报告中强调,要设立新兴产业创业创新平台,在大数据等方面赶超先进,引领未来产业发展。21世纪,是一个大规模生产、分享和利用数据的时代。正如微软公司所说,“给我提供一些数据,我就能做一些改变。如果给我提供所有数据,我就能拯救世界。”随着云计算、云存储、物联网等新一代信息技术的广泛应用,多样的、海量的数据以爆炸般的速度生成,大数据时代已经到来。自2011年起,大数据的影响范围从企业领域扩展到社会领域,所蕴含的巨大商业价值和社会价值开始凸显,又被称为“未来的新石油”、“类似货币或黄金的新型经济资产”。据美国研究机构统计,大数据能够为美国医疗服务业每年带来3000亿美元的价值,为欧洲的公共管理每年带来2500亿欧元的价值,帮助美国零售业提升60%净利润,帮助美国制造业降低50%产品开发、组装成本。认识大数据带来的变革,并规划好大数据的发展,将是各级党委政府在大数据时代的当务之急。围绕“何为大数据、有什么影响、如何利用好”这三个问题,市委办研究室会同市统计局进行了专题研究,现形成报告如下:
一、什么是大数据
大数据(big data),或称巨量资料、海量资料,是由数量巨大、结构复杂、类型众多数据构成的数据集合,所涉及的资料量往往规模巨大,无法通过目前主流软件在合理时间内收集、管理、利用。大数据是与智能制造、无线网络革命并行的又一次颠覆性的技术变革,是基于云计算的数据处理与应用模式,从海量数据中“提纯”出有用的信息,形成的智力资源和知识服务能力。
对于大数据,通常被认为具有“4V”主要特征,即海量化(Volume)、多样化(Variety)、快速化(Velocity)和价值化(Value)。海量和多样是对大数据的数据量与数据类型的界定;快速是对大数据获取、处理、分析速度的要求;价值是对大数据获取、处理、分析的意义和目的。具体来说,其一,数据体量巨大。大数据的起始计量单位从TB级别(1T=1000个G),跃升到PB级别(1P=1000个T)或EB级别(1E=100万个T)或ZB级别(1Z=10亿个T)。根据观研天下机构监测统计,2011年全球数据总量已经达到1.8ZB,相当于18亿个1TB移动硬盘的存储量,而这个数值还在以每两年翻一番的速度增长,预计到2020年全球将总共拥有35ZB的数据量,增长近20倍。其二,数据类型繁多。现在的数据类型不仅是文本形式,更多的是图片、视频、音频、地理位置信息等多类型的数据,个性化数据占绝大多数。其三,价值密度低,商业价值高。以视频为例,连续不间断监控过程中,可能有用的数据仅仅有一两秒。对于商业而言,开源分析机构Wikibon统计,2012年全球大数据企业营业收入为50亿美元,未来5年的市场复合年增长率将达到58%,2017年将达到500亿美元。其四,处理速度快。符合1秒定律,即对处理速度有要求,一般要在秒级时间范围内给出分析结果,时间太长就失去价值。这个速度要求是大数据处理技术和传统的数据挖掘技术最大的区别。
二、大数据带来的影响
大数据发展之快,已远远超出人们的想象。据不完全统计,近3年的信息数据总量已经超过以往400年的总和,人类社会发展的核心驱动力,已由“动力驱动”转变为“数据驱动”;经济活动重点,已从材料的使用转移到大数据的使用。对于大数据的发展,全球知名咨询公司麦肯锡研究认为,数据已经渗透到每一个行业和业务职能领域,逐渐成为重要的生产因素,人们对于海量数据的运用将预示着新一波生产率增长浪潮的到来。大数据已经开启了一次重大的时代转型,成为新发明和新服务的源泉,对我们的生活、工作以及理解世界的方式带来不可估量的影响。
(一)大数据带来新的思维变革
在以前,数据一旦完成了收集的目的后,就会被认为已经没有用处。比如说,在飞机降落之后,票价数据就没有用了。但在大数据时代,数据不再是静止的、陈旧的,数据的海量收集只是发掘大数据潜在价值的基础和开始。什么是大数据思维?一是需要全部数据而不是抽样。统计抽样只是在技术受限的特定时期,解决当时存在的一些特定问题而产生的。如今,技术环境已经有了很大改善,虽然在某些特定的情况下,我们依然可以使用样本分析法,但这不再是我们分析数据的主要方式。大数据时代,由于可以分析的信息量更多,有时候甚至可以处理和某个特别现象相关的所有数据,故而采用“样本=总体”的全数据模式。通过采集、分析所有数据,我们可以在大量数据中找到以往不容易被发现的信息。例如,谷歌流感趋势预测并不是依赖于对随机样本的分析,而是分析了整个美国几十亿条互联网检索记录,通过对数据库的系统分析,提高了微观层面分析的准确性,甚至能够推测出某个特定城市的流感状况,而不只是一个州或是整个国家的情况。二是关注效率而不是精确度。执迷于精确性是信息缺乏时代和模拟时代的产物。只有5%的数据是结构化且能适用于传统数据库的,如果不接受混乱,剩下95%的非结构化数据都无法被利用。在大数据中,允许不精确的出现已经成为一个新的亮点,而非缺点。因为放松了容错的标准,人们掌握的数据也多了起来,通过大量数据的分析往往创造更好的结果。比如,对于通货膨胀率的判断,美国联邦政府每年会向全美90个城市的商店、办公室打电话、发传真甚至登门拜访搜集价格信息,种类达到8万种,这些数据是精确的也是有序的,但从采集到整理再到公布会有几周的滞后。2008年的经济危机表明,这个滞后是致命的。麻省理工学院对此提出了一个大数据方案,通过软件在互联网上每天收集50万种商品的价格。虽然收集的数据很混乱,但是与好的分析法相结合,这个项目在2008年9月雷曼兄弟破产后马上就发现了通货紧缩趋势,然而那些依赖于精确数据的人直到11月份才分析出这个趋势。三是关注相关性而不是因果关系。建立在相关关系分析法基础上的预测是大数据的核心。大数据的出现让人们放弃了对因果关系的渴求,转而关注相关关系,人们只需知道“是什么”,而不用知道“为什么”,相关关系帮助我们更好地了解这个世界。这颠覆了千百年来人类的思维模式,对人类的认知方式和交流方式提出了新挑战。例如,Wal-Mart作为零售行业的巨头,他们的分析人员会对每个阶段的销售记录进行全面的分析,有一次他们无意中发现很有价值的数据,在美国的飓风来临季节,超市的蛋挞和抵御飓风物品竟然销量都有大幅增加,于是他们将蛋挞的销售位置移到了飓风物品销售区域旁边,没有想到蛋挞的销量又大幅提高。这个例子表明,我们没必要一定要找出相关关系背后的原因,当我们知道了“是什么”的时候,关于到底是季节因素还是消费者口味变化或者其他原因导致蛋挞销量增加,其实就没有那么重要了。
(二)大数据带来新的商业变革
大数据是什么?企业家眼里是两个字:资产。如果把大数据比作一种资产,那么这种资产实现盈利的关键,在于提高对数据的“加工能力”,通过“加工”实现数据的“增值”。这种基于大数据的挖掘利用,已经为不少的企业带来了盈利和声誉。近年来,IBM热衷于数据挖掘和数据分析领域的收购,先后出资160亿美元收购了超过30家大数据企业;Oracle收购石油、电气和供水公司推动大数据深入应用;Microsoft、Google、Intel等信息类跨国公司纷纷转型为大数据公司。传统企业也积极探索利用大数据创新业务模式,如美国福特汽车公司在硅谷创立实验室,处理大量汽车相关数据;Target超市以20多种怀孕期间孕妇可能会购买的商品为基础,将所有用户的购买记录作为数据来源,通过构建模型分析购买者的行为相关性,能准确推断出孕妇的具体临盆时间,这样销售部门就可以有针对的在每个怀孕顾客的不同阶段寄送相应的产品优惠券,带来营业收入的大幅提高。这些都印证了一个很有指导意义的观点:通过找出一个关联物并监控它,就可以预测未来,从数据中获取利益。
对于企业的大数据,有一种预测:随着数据逐渐成为企业的一种资产,数据产业会向传统企业的供应链模式发展,最终形成“数据供应链”。从目前企业大数据的价值链条来分析,存在三种形式:一是手握大数据,但是没有利用好,比较典型的是金融机构、电信行业等。二是没有数据,但是知道如何帮助有数据的人利用它,比较典型的是IT咨询和服务企业,比如IBM、Oracle等。三是既有数据,又有大数据思维,比较典型的是Google、百度、阿里巴巴等。未来在大数据领域最具有价值的是两种事物:一是拥有大数据思维的人,这种人可以将大数据的潜在价值转化为实际利益;二是还未被大数据触及过的业务领域。这些是还未被挖掘的油井、金矿,是所谓的蓝海。利用大数据,企业可以创新商业模式,比如,基于用户行为数据,可以进行精准广告投放、内容推荐、行为习惯和喜好分析、产品优化等;基于用户消费数据,可以进行精准营销、信用记录分析、活动促销、理财等;基于用户地理位置数据,可以进行O2O推广、商家推荐、交友推荐等;基于互联网金融数据,可以开展P2P、小额贷款、供应链金融等;基于用户社交等UGC数据,可以进行趋势分析、流行元素分析、受欢迎程度分析、社会问题分析等。
(三)大数据带来新的管理变革
随着大数据时代的来临,大数据已经上升为世界各国的国家战略,其所蕴含的巨大社会、经济和科研价值是受到各个国家广泛关注的根本原因。开发利用大数据,不仅可以提高社会生产力、创造新的社会价值,而且可以提高政府效能水平和服务水平、加快创新能力建设。
从国际情况看,联合国“数据脉动”计划(旨在通过对大数据进行分析从而为社会发展寻求解决方案,比如广泛利用移动电话数据,跟踪人们的活动轨迹或者用于评估流感疫情等)、美国“大数据”战略(2012年3月,奥马巴政府公布了“大数据研发计划”,投资2亿美元,旨在提高人们从海量和复杂数据中获取知识的能力,从而提高美国科研、教育、国家安全和社会管理能力)、英国“数据权”运动(2010年1月,英国政府率先提出了“数据权”的概念,并将其视为信息时代每一个公民都拥有的一项基本权利)、日本“面向2020年的ICT综合战略”(2013年6月,日本公布新IT战略,确立2013—2020年期间以发展开放公共数据和大数据为核心,创建最尖端IT国家)、韩国大数据中心战略(提出将信息技术作为韩国经济增长的一个新支柱,着力构建智慧城市所需基础设施,建设一个大数据中心,任何人均可通过该中心对大数据进行提炼和分析)等先后开启了大数据战略的大幕,有力推动了大数据产业化、市场化进程。
从我国情况看,无论是网民数量、发展速度,还是网络规模和应用方式,都已经进入信息化大国和网络大国的行列。我国已于2012年10月成立了中国通信学会大数据专家委员会。最近,十多位院士建议,国家应制定大数据国家战略,并在发展目标、发展原则、关键技术等方面作出顶层设计。同时,在《关于实施大数据国家战略研究》报告中指出,要“通过国家层面的战略规划明确大数据产业的发展重点、空间布局和保障措施,推动和改善与大数据相关的收集、储存和分析工具及技术,并在公共服务领域如安防、医疗、卫生、教育等开展大数据应用示范,提高应急处置能力和安全防范能力,提升服务能力和运作效率。”与此同时,国家发改委与中科院正在启动“基础研究大数据服务平台应用示范项目”。权威人士透露,大数据国家战略或将提上议程。
三、如何利用好大数据
大数据时代已经来临,它将在众多领域掀起变革的巨浪。把握大势,利用好大数据,结合我市发展实际,建议如下:
(一)整合政府信息资源,解决大数据如何来的问题。巧妇难为无米之炊,大数据利用的关键还是在于谁先能够海量收集数据。从发展实际看,像BAT(百度、阿里巴巴、腾讯)类似的大型IT企业,为客户提供服务的过程就是一个收集数据的过程,因此其本身就是一个大型的数据库。但我市目前来说,尚没有类似的机构或企业,现阶段直接从市场中获得海量数据不太现实。同时,我们可以看到,政府机构也是重要的大数据生产者和保有者,各个部门都握有构成社会基础的原始数据,比如市场信用信息平台拥有大量市场主体基本数据,环保物联网平台拥有企业排污数据,企业一套表统计系统拥有各类企业生产数据,金融机构拥有全市金融数据和信用数据,同时还有气象数据、电力数据、煤气数据、自来水数据、道路交通数据、客运数据、安全刑事案件数据、住房数据、旅游数据、医疗数据、教育数据等等。这些数据在每个政府部门里面看起来是单一的、静态的,甚至是重复的、闲置的。但是如果可以将这些数据关联起来,并对这些数据进行有效的关联分析和统一管理,并加以开发利用,将产生极大的社会和经济效益,其价值是无法估量的。因此,建议现阶段以整合政府部门基础数据为重点,待工作机制、技术运用等成熟后再逐步扩大到企业、村(社区)等社会各个角落,最终构建政府、企业、市民等社会多方共同参与的大数据收集格局。
(二)加快要素资源引进,解决平台怎么建的问题。数据处理平台是大数据时代的发动机。从技术层面来说,大数据常和云计算、云存储联系到一起,因为实时的大型数据集分析需要云计算的分布式处理框架来向数十、数百甚至数万的电脑分配工作。可以说,没有云计算的处理能力,大数据的信息积淀再丰富,也终究只是镜花水月。我市在全国同级城市率先打造的环保物联网平台,正是利用云计算等先进技术,建设具有智能感知、高性能计算、海量数据存储与分析能力的环保信息感知和管理体系。因此,建设一个或者多个基于云计算技术的数据处理平台,是融入大数据时代、向数据要生产力的关键。要着力做好三个方面:首先,引进综合分析机构,由统计、发改、工信、环保、工商、交通等手握大量基础数据的政府部门共同参与,制定基于整合政府基础数据的可行性方案,将相对孤立的部门大量数据有机纳入到一个系统操作。其次,引进IT技术公司,按照预定整合方案,为我市开发以云计算技术为基础的“数据综合信息管理平台”,构建集数据收集、管理、共享、分析、利用等一体化运用体系,为政府在民生、经济等领域制定决策提供帮助。第三,引进高层次、高技术人才,完善人才扶持政策,加大对云计算、物联网等高端IT人才以及数理统计、数字模型等高端数据分析人才的引进力度,为大数据的开发利用提供强有力的智力支撑。
(三)建设重点应用工程,解决大数据怎么用的问题。数据只有被利用的时候才会有价值。目前,国内很多城市都在走向智能和智慧,比如智能电网、智慧交通、智慧环保等等,这些都依托于大数据,可以说大数据是建设智慧城市的核心能源。到2012年底,全国开建智慧城市的城市数已超过180个。青岛市已经提出建设智慧城市,我市也在积极制定智慧胶州建设的相关意见。要在智慧城市建设中,充分挖掘和发挥大数据的作用,加快重点应用工程建设,全面提升工作水平。一是建设产业发展服务平台。针对不同行业的大数据应用模式、商业模式研究,将有力推动产业快速转型发展。海尔集团牵手阿里巴巴,利用阿里巴巴在电商领域的优势,改变了过去由供应商直接把商品卖给用户的B2C模式,提出了消费者对企业定制商品的全新C2B模式。我市一些企业也在积极探索争取大数据带来的红利,青岛软控通过在轮胎中植入传感芯片,分析监控数以万计的轮胎使用情况,以此提高产品核心竞争力。要积极引导企业认识大数据、利用大数据,横向打通各部门面向企业的各项信息收集系统,加大对各行业产品生产、技术需求、存销量等数据资源的共享和分析,在政务、融资、法律、管理咨询、人力资源等方面为企业提供更具有针对性、更加优质的一站式服务。二是建设城市智能管理平台。利用各部门的业务数据、视频图像、地理信息、应急资源等信息,建设城市运行管理中心,全面提高数字化、智能化管理水平。比如,在交通管理方面,通过对道路交通信息的实时挖掘,有效缓解交通拥堵,并快速响应突发状况。如通过采集驾驶员手机的GPS数据,分析出当前哪些道路正在堵车,及时发布道路交通提醒。在金融监管方面,通过对全市企业的融资信息进行关联分析,全面掌握企业担保互保情况,对重点企业进行重点监控,提高金融稳定水平。在舆情监控方面,通过网络关键词搜索及语义智能分析,提高舆情分析的及时性、全面性,全面掌握社情民意,应对网络突发的公共事件,打击违法犯罪。三是建设为民融合服务平台。加快推进党建网、平安网、民生网“三网”融合,构建数字化、智能化党建系统平台,通过实时感知、在线收集、综合分析基层动态数据,提高党组织针对性管理服务水平。建设市民信息基础数据库,通过分析民生服务各领域的大量数据,开创数字化服务全新模式。比如,通过收集、分析基层群众就医数据,超前预测某个镇(街道)甚至是村(社区)某种疾病的发生状况,提高疾病预防和控制能力。