上海首度开放容量达上千GB的十大数据集 城市“数据金矿”万众开掘

18.11.2015  18:06


  上季度,我国国家层面出台《促进大数据发展行动纲要》,系统部署“中国大数据”。事实上,目前中国数据产生量已占全球数据产生量53%左右,中国成为最大的数据制造国。但,数据只是原料。

  这么多数据能干什么?至少可以吸引海内外817个团组,提供505个有效解决方案。从城市道路交通指数、地铁运行数据、一卡通刷卡数据、浦东公交车实时数据,强生出租车行车数据,到空气质量状况、气象数据、道路事故数据、高架匝道关闭数据、新浪微博交通数据——上海首度开放容量达上千GB的十大数据集,日前最终形成了基于这些大数据的15个数据产品。

  坐拥城市数据金矿,如何发动万众开掘,不再让数据只是原料。

  开放“政府数据”成为世界潮流

  早在2009年,美国政府数据门户data.gov上线,“开放数据运动”席卷全球,美、英、法、日等国纷纷将数据资源开放利用,纳入国家发展战略。至今,全球约70个国家和地区开放公共数据信息资源,也就是说世界上1/3左右国家和地区施行这一“开放政策”。

  据了解,2018年前,我国也将建成国家政府数据统一开放门户,推进政府和公共部门数据资源统一汇聚和集中,实现面向社会的政府数据资源一站式开放服务。

  “政府数据开放正成为一种全球性趋势。”中央网信办信息发展局副巡视员章晓杭日前在沪表示,我国这方面处于起步阶段,开放度排名还比较靠后。但上海正走在全国前列,截至今夏,全国首个政府数据服务网站——“上海市政府数据服务网”,已累计开放数据集逾500项,涵盖了经济建设、资源环境、教育科技、道路交通等11个重点领域,力争今年年底开放数据集达到1000个,实现总量翻番。

  推倒“信息烟囱”才有倍乘效应

  政府数据不再是“政府专利”。同时,各部门数据也不能是“某部私有”。上海约在3年前开始向社会开放数据资源,现已进入全面推进阶段,由早先的9家试点单位拓展至目前的40多家市级政府部门。其中,如市交通委开放了包括全市搬场企业名录、全市公交枢纽站分布、中心城区公交站点分布、停车场位置等数据;市住房保障管理局开放了保障房工程信息、房地产开发企业信息、房地产经纪企业信息等数据。

  这些政府数据原本是深藏于地下的“秘密矿藏”,如今升至地面。而另一方面,如果这些数据只是公开、而无关联,那么仅仅就如一座座冒着数据的“信息烟囱”。当烟囱被推倒,各部门数据发生有趣的叠加,便会产生奇妙的倍乘。从新能源汽车租赁、杠铃公交通勤、众包骑行生活到出租车合乘模式,参加此次上海开放数据创新应用大赛的开发者团队,正是看中了大数据的倍乘效应,在几乎每个数据产品中都引入了多个专用数据集。

  用好“数据投资”也能创造价值

  眼下,数据服务类创业相当活跃,他们需要的最大资本可能不是投入资金,而是投入数据。

  市经信委信息化推进处负责人认为,政务数据资源作为公共资源的一种,其共享和开放有利于各类市场主体平等高效使用政府数据资源,促进全社会力量共同参与经济社会管理。不难发现,部分政府开放数据已被信息服务企业以及这类创业企业调取利用,带动“四新”经济发展以及跨界融合的创新应用正在涌现,大数据可供大量开掘的经济价值正初步显现。

  申城大型出租车公司数千辆的士,每隔10秒的位置信息形成无数轨迹,时时刻刻产生着海量数据。这些数据富矿如果只是一家企业独享,其社会效益无法最大化。而社会开发者借此数据集挖出的应用则是五花八门,比如名为“保卫橙子”的新应用,就利用这样的出租车行驶轨迹,计算出不同路段不同时间的平均车速,设计了“相对超速”的风险驾驶指标。