复旦大学推出首个中国高校社会科学数据平台

29.12.2014  18:11

2014年12月29日,复旦大学社会科学数据平台正式上线仪式在上海举行。该平台是第一家中国高校社会科学数据平台,为高校、研究机构和政府部门提供科研数据的存储、发布、交换、共享与在线分析等功能。复旦大学同时还在该平台上发布了中国历史地理信息系统项目(CHGIS)、复旦大学能源流向与碳排放因子数据库(FDED)、长三角社会变迁调查数据(FYRST)、杭州都市圈数据库等多项特色数据集。目前存储在平台上的数据集已达1377个,可在平台上直接下载或申请调用。这是复旦大学整合多学科优势全面介入数据挖掘、分析和利用的一项基础学科建设,也是复旦大学推进以数据为基础的社会科学研究和决策咨询、用数据技术建设智慧中国的一个重要举措。

复旦大学社会科学数据研究中心主任彭希哲教授主持了正式上线仪式并简单回顾了数据平台的建设过程。他指出,社会科学研究需要大量的原创、定期、系统和持续的社会科学数据,国际经验表明高质量的、拥有自主知识产权的社会科学数据是产生重大学术成就的坚实基础,国内在这方面起步较晚、但发展迅速。复旦大学社会科学数据平台将建设成一个高质量的具有公信力的社会科学研究数据交换共享平台,促进社会科学学科发展并培育对国家和地区公共政策制定有影响力的学术成果。

复旦大学副校长林尚立教授在致辞中表示,复旦大学将统筹推动数据研究中心和数据平台的建设,收集、整理和开发中国社会经济发展数据,成为国内外社会科学研究的重要资料中心,为学科发展和政府决策提供服务,为复旦大学履行大学传承、记录文明的职责和成为 “国家智库”提供重要和基础性的支撑。

接下来举行了数据平台正式上线仪式,林尚立副校长、彭希哲教授、潘克西副教授、路伟东副教授、殷沈琴副研究馆员一起点亮水晶球,宣布了复旦大学社会科学数据平台正式上线。复旦大学社会科学数据研究中心副主任、复旦大学图书馆副馆长张计龙介绍了数据平台的功能。复旦大学中国历史地理研究所路伟东副教授对“中国历史地理信息系统”进行演示,复旦大学社会发展与公共政策学院潘克西副教授对“能源流向与碳排放因子数据库”进行演示。

复旦大学从2004年就开始对建设社会科学数据库进行多方研讨和论证。2011年11月复旦大学社会科学数据研究中心正式成立,并于2012年初开始建设社会科学数据平台。经过一年时间的国内外社会科学数据平台调研,于2013年选定了与哈佛大学-麻省理工大学数据中心合作,共同开发建设中国高校第一家社会科学数据平台。复旦大学与哈佛大学签署协议,由复旦大学社会科学数据研究中心全面负责大中华区的Dataverse Network的国际化、汉化、二次开发和宣传推广等工作。2013年1-12月,复旦大学完成了数据平台汉化、二次开发、数据摄取测试、制定元数据规范和数据监护规范等工作。2014年6月,数据平台开始上线试运行。平台访问地址http://dvn.fudan.edu.cn

目前,复旦大学社会科学数据平台上已积累了大量数据:(1)开放数据,开放的数据共有数据集57个,课题:664 个,文件:1,046个;(2)存储在平台的数据,由复旦大学文科科研处提供,数据集1320个,涵盖教师1319名、项目5153个和研究成果45835条。数据平台是开放共享的平台,研究人员可在平台上进行科研数据的存储、发布、交换、共享与在线分析。平台正式上线后,数据集将进一步快速增长。

2014年10月23日,复旦大学牵头联合北京大学、清华大学、北京理工大学、浙江大学、武汉大学、上海交通大学、上海外国语大学、同济大学等九所高校,共同发起“中国高校图书馆研究数据管理推进工作组,合力推进国内高校研究数据管理事业发展,秘书处设立在复旦大学。

平台的专题数据简介

平台的特色数据集包括,复旦大学能源流向与碳排放因子数据库、中国历史地理信息系统CHGIS,长三角社会变迁调查数据,杭州都市圈杭湖嘉绍数据等。

复旦大学能源流向与碳排放因子数据库(FDED),由中国煤炭流向与潜在碳排放因子数据库(CCEF)、分省分品种能源流向图(EFDPT)、温室气体清单计算器(GHGC)、全球能源与碳排放数据集(WECD)、复旦能源行动(FDEA)等学术、科研平台组成;主要功能是数据核算、在线分析、成果共享;强调数据的可分解、可回溯,方法的系统性、互联性,产出的全过程、共生性。为能源职业人士以及学者、学子提供专业的数据支撑、方法比选、愿景对标,为政界、企业界提供系统的政策模拟、情景仿真、解决方案与路线图。

中国历史地理信息系统项目(CHGIS)于2001年1月8日正式启动,该项目由[罗斯基金会]资助。 CHGIS项目试图建立一套中国历史时期连续变化的基础地理信息库,为研究者GIS数据平台、时间统计以及查寻工具和模型。CHGIS数据的版权归项目管理委员会所有,但同时,每一个提供数据的学术团体,具有以他们认为适当的方式进一步修改他们自己数据的权力。目前,中国历史地理信息系统(CHGIS)的数据包括三部分:中国历史地理信息系统(CHGIS)Time Series 时间序列数据、中国历史地理信息系统(CHGIS)1820年数据、中国历史地理信息系统(CHGIS)1911年数据。

长三角社会变迁调查数据为首次对公众开放的数据。长三角社会变迁调查,跟踪1980-1989年(简称80后)出生的一代人为主体,以长三角地区为调查区域,深度了解调查对象和所处社区的过去三十年以及未来的发展变化情况的大型综合调查。研究的范围包括这一代人的家庭、婚姻、就业、迁移、住房、生育、子女教育、父母养老等各个方面。这一研究对分析和了解中国社会在产业(后)工业化、生活城市化、经济全球化、人口老龄化的全方位变迁具有极为重要的意义。

杭州都市圈是以杭州市区为中心,联结湖州市区、嘉兴市区、绍兴市区三个副中心,包括萧山区、余杭区、杭州市域5 县市及德清、安吉、海宁、桐乡、诸暨、绍兴柯桥区等杭州相邻的6 县市。本研究对2007-2013年期间杭州都市圈各个区县的经济、社会、人口、资源等重要指标发展趋势进行了逐一回顾,并对其竞争力进行了简要分析。一方面为促进各成员城市之间的了解、实现优势互补、寻找发展空间提供参考,另一方面也可对推进杭州都市圈的统筹、协调发展以及提高区域竞争力提供咨询。本研究是一本直观反映杭州都市圈 2007‐\2013 年间发展状况的图集,其内容主要是这六年间各个城市各项指标在时间和空间上的直观呈现以及各城市之间的相互比较。

平台的特色功能

(1)数据监护:采用DDI元数据规范,用超过100种可检索的字段去定义一个课题,帮助制定科学数据管理计划,辅助进行数据筛选和数据处理,自动转换数据格式,实现数据的长期保存。

(2)数据共享:收割国内外科学数据平台的数据,创建不同形式的收藏集,实现对课题的版本管理,分级别分层次控制对数据的访问权限,并且能和您的个人站点实现无缝链接。

(3)数据引证:采用句柄系统唯一标识数据,数据能够直接被公开出版物引证。

(4)数据分析:对科学数据可以重新编码和抽取子集,提供多种高级统计分析模型,多层次多角度展现数据,并能实现数据可视化。

平台大事记

复旦大学社会科学数据平台从985三期开始建设。

 2012年4月-11月国内外社会科学数据平台调研

 2012年10月—2013年3月平台选型

 2013年3月与哈佛签署合作协议

 2013年10月—2014年1月上海市信息安全测评

 2013年4月--开始平台数据摄取测试

 2013年1月--12月制定《复旦大学社会科学数据平台元数据规范

 2013年1月--12月制定《复旦大学社会科学数据平台数据监护规范

 2013年1月-12月平台汉化和二次开发

 2013年4月-2014年4月《复旦大学社会科学数据管理条例》调研和制定

 2014年6月平台上线试运行