对直接抓取企业大数据的预期思考
国家统计局积极推进大数据战略,打造数据采集第二轨,与大数据企业签署战略合作协议,迈出实质性步伐,同时搜集公共平台或网上交易的大数据,在多个专业领域颇有收获。马建堂局长在全国统计工作会议上强调,2015年继续加大力度,奋力打造数据生产新兴之轨。特别是引起注意的是,计划加快研究开发企业电子化生产经营记录自动导入统计联网直报系统的技术,实现国家从企业直接抓取电子化原始数据,这是十分闪亮的计划,是直逼大数据采集的前沿,获取大数据的攻坚战,是对大数据开发的突破性进展,决定性的推进。
预期看,直接抓取企业大数据,将完全打开政府统计的视野,展现出全新的一览无余的政府统计景观。现在是以“企业一套表”为核心的统计“四大工程”,使数据采集生产方式由以往重复、分散、各专业各行其是的传统“小生产”模式,向以联网直报为特征的现代“大生产”模式转变。如果实现直接抓取企业数据,数据采集的生产方式将由一套表的联网直报的“大生产”模式,向以大数据时代直接抓取企业原始数据为特征的“超大生产”方式转变。直接抓取原始数据,是把企业生产经营的,没有加工痕迹的全部数据直接导入到政府统计平台上。数据自然而清澈,质量和精确度高,信息含量丰富;数据的可拓展面扩大,可探索性加深。政府统计直接挖掘,将会极大地提高统计的现代化服务水平,更有效地服务于改革发展。
因此,直接抓取大数据是统计深化改革的重点,是政府统计服务于发展的历史责任,开发利用大数据的战略任务,必须强力推进。在技术上加快研究,在实施的预期上也必须有积极充分的准备。大数据开发战略实施以来,政府统计作用和收集大数据是在公共的网络数据平台上,是在企业的外围探索收集,接触企业还是处在与企业签署合作协议,共同开发的层面上。不能不意识到直接抓取企业大数据的难度不仅在技术上,在操作落实上一定存在着障碍。直接抓取企业的大数据,实现生产经营的全部记录导入政府统计数据平台,对企业而言,如同把家底的情况全都端出来,在观念上和操作上是不习惯的,会有顾虑,会产生阻力。所以,为实现对企业直接抓取大数据的目标,在加快技术研究的同时,在观念和行动上要有预期的认识与准备,以便齐头并进。
首先应当清楚地认识到,企业的大数据是企业市场经营过程中的产物,是外界公共环境的支撑和不同行业、不同人员参与的结果,没有宏大和海量的外界公共资源作用是不会产生大数据的。所以企业数据不仅仅是记录着其自家的经营情况,也还蕴藏着丰富的公共数据资源,反映着宏观经济的发展变化,体现着极强的社会公共资源的特征,公共的数据资源是需要政府统计加以管理与开发的。二是直接抓取大数据是企业报表形式在大数据时代的升级版。由于直接导入原始数据,企业将不再按表式对原始数据进行汇总上报,是以零成本报表,从根本上消除了企业报表的负担,是企业报表形式的精彩蜕变。
预想直接抓取企业大数据的情形,就联想到了住户调查数据的上报形式。住户调查记账户是每发生一笔就记一笔,特别是实施电子记账后,是家庭全部收支的电子记录,上报的不是报表,而是全部的原始数据。可以说,记账户做到了把生产的每笔数据直接导入到政府统计的平台上。是直接抓取大数据的雏形、先驱,无意中已经给企业打了个样,做了榜样。企业的生产经营管理记录也无非是收支记录,相对不同的是企业是法人单位,法的作用力要增强,需要更加强调的是依法办事,依法实施。
直接抓取企业大数据需要法治为引领和规范,法治保障和支撑。直接抓取原始数据与上报统计报表是有很大区别的,要探索如何用法治思维和法治方式推进。针对实施的法律要求,制定相应的法律规定。强化法的规定性,推出细则,明确责任与义务。把直接抓取大数据纳入法治轨道,做到有法可依,立法先行,依法组织实施,充分得到各方的支持配合,确保直接抓取企业大数据畅通无阻。去年国家统计局依法编发了《大数据企业统计指标旬报》,表明国家统计局关于大数据战略的法治建设在积极推进,依法实现直接抓取企业大数据为期不远了。