7月22日,复旦大学联合国家信息中心数字中国研究院,发布了《2020中国地方政府数据开放报告》及“2020中国开放数林指数”。全国省级开放数林指数排名中,山东省位列第3位。地级城市排名中,山东省有7城市入围全国前二十名,是入围数量最多的省份。
用“数”,已经不是自选动作,而是全国共识。数据开放过程中,山东省如何打破壁垒,数据开放过程中又有哪些现实难题,记者进行了探访。
政府数据开放平台成为“标配”
在山东公共数据开放网上,记者看到了大量数据“表单”,数据量大,颗粒度细,但难以在短时间内提取到内在规律。
“‘数据开放’发布的是原始数据、基本要素,满足的是社会对数据进行再利用的需求。”复旦大学数字与移动治理实验室主任郑磊告诉记者。
海量数据中,政府数据最受关注。“政府部门掌握着大量基础性、关键性的数据资源,涉及政府运行、经济发展、社会治理等各个领域。这些数据恰恰很重要很关键。”省大数据局数据管理应用与安全处处长杨峰介绍。
认清数据价值,山东省大力推进数据开放,在省级开放数林指数排名中山东省列全国第三位。地级(含副省级)开放数林指数排名前二十位的城市中,山东省的烟台、济南、潍坊、青岛、临沂、威海、德州7城市入围,城市数据开放指数也走在前列。
从全国看,政府数据开放的力度在持续加大。2017年18个,2018年56个,2019年102个,2020年上半年130个——《报告》显示,目前我国54.83%的省级行政区(不包含港澳台)、73.33%的副省级和32.08%的地级行政区已推出了政府数据开放平台,政府数据开放平台日渐成为地方数字政府建设和公共数据治理的标配。
数据治理能力迎接大考
数据开放大势已来,但无论山东省还是兄弟省份,数据开放量都没有迎来井喷式增长。究其原因,背后的数据治理能力在迎接大考。
记者走访了解到,目前海量数据的一个问题是量大但质不优:各部门信息化发展水平不平衡,有的部门核心业务没有电子化,许多业务信息仍以纸质形式存在;有的部门业务工作缺乏标准规范,导致数据不全、质量不高;有的数据没有进行模块化堆放,没有分类存储。
对此,去年以来山东省大力推进数据采集、汇聚工作,构建基础库、主题库、专题库和通用办公库“四库一体”的数据资源体系,形成共建、共享、共用的“数据湖”,目前,已汇聚各类数据62亿余条。政府管理层面数据共享壁垒正在打破,职能条款分割带来的共享渠道不畅正在破解。山东省建设的省市两级政务信息资源共享交换平台,目前省数据共享平台累计为各级各部门提供服务16.9亿余次,省公共数据开放平台发布数据12亿条,分别较年初增长245%、45%。
对数据安全的担忧也让不少主体对数据开放望而却步。流通数据,如同高空走钢丝,必须在数据隐私保护与数据开放共享之间保持必要的平衡,风险不言而喻。目前全国各地还未形成成熟的“平衡”经验。“山东省目前主要依靠技术、内容两端用力,既通过技术手段保证数据的安全,又在内容做好脱敏,从源头上做好把控。”杨峰介绍。
市场参与挖掘数据潜能
5月底,山东省数据应用(青岛)创新创业大赛落幕。大赛组委会提供了15大领域3.6亿条数据,涉及道路交通、民生就业、经济发展等各个方面,由此吸引了1000余个机构、2400余支队伍、3500余人次参加,收到作品9600余件。“比如,‘城市交通流量时空预测’赛道,参赛队伍根据历史数据预测某路段的车流量,预测结果与实际结果的平均误差仅为38辆。又比如‘青岛人口与发展信息数据平台’方案,基于人口统计、医保等多维数据,开展人口承载力监测分析,为政府分配养老资源提供了重要参考。”省大数据局副局长顾卫东说。
数据一经开放,“百花竞放”的场景很快产生:墨迹天气、航旅纵横、飞常准、腾讯看点、智慧足记……同样的底层数据,有人做地图,有人做指数,有人做应用,市场各取所需、各显神通。
技术上的门槛是显而易见的。可机读的基础数据,对数据浏览者提出了技术要求,需要专业人士开发利用。从数据应用(青岛)创新创业大赛的参赛队伍看,山东省的数据吸引了清华大学、北京大学、慕尼黑工业大学等国内外知名高校209所,阿里巴巴、Facebook、联通等知名科技企业116个,但山东省本土队伍较少。
更根本的原因在观念。“此前我们也发动了一些公司和开发者基于已经开放的数据做了便民利民的查询和应用,但从山东省公共数据开放网数据应用栏目发布的应用数量看,社会应用公共数据的意识还不强,办法还不多,山东互联网企业的意识相对先进省份还有差距。”杨峰坦言,“数据开放是手段而不是目的。必须以需求为牵引,通过数据开放培育数据创新生态,实现数据价值释放,形成数据流动闭环。”
顾卫东介绍,下一步山东省将以公共数据资源开发利用国家试点工作为契机,制定出台《山东省公共数据开放管理办法》,进一步加强数据开放平台支撑能力建设,增强数据安全保障功能,不断提升山东省公共开放数据开放及开发利用水平。(陈晓婉)