李国杰:大数据时代的国家治理
 
 

史坦国际STANCHINA

 
 
226日上午,在人民大学召开了一场以“开放政府数据”为题的研讨会,会议由中国人民大学社会转型与社会管理协同创新中心主办,由中国人民大学原常务副校长、社会转型与社会管理协同创新中心主任冯慧玲主持。中国人民大学校长陈雨露会见与会嘉宾。中国工程院院士、中国计算学会大数据专家委员会主任李国杰做了题为“数据共享——大数据时代国家治理体系现代化的前提”的精彩演讲。以下文字摘自李院士演讲。

本来是重点讲一些怎样评价一个城市或一个国家数据开放做的好不好的标准,后来想一下这个问题还是第二位的,我觉得最大的一个问题还是理念问题

我们国家在十八届三中全会上,有一个提法,“全面深化改革的总目标是完善和发展中国特色社会主义制度,推进国家治理体系和治理能力现代化。”这个提法是很高贵的,以前很少用这样的话来写我们的目标。其中最关键的两个字是“治理”,这个“治理”是很多搞管理的同志都讨论过的,和过去讲的治国啊、统治啊、管理都有联系,但是还是有比较大的区别的。这里的“治理”是强调多元主体的管理,民主的,参与式、互动式的管理,而不是单一主体管理,不一定是从上到下单线的管理,所以国家管理者、广大群众、各组织、各单位都是主体之一,从过去的一个主体变为多主体,从过去单向的从上到下管理变成各个方向协调的治理。所以作为国家的治理者之一,作为政府的官员们应该具备大数据的思维方式,现在讲的比较多的互联网思维,大数据思维,计算思维等等,都是一些新的思维和理念。通过对数据的整理分析,预测民众的下一步公共服务需求,以便提供更加智能与高效率的管理和服务,促进国家和社会发展。
 

一份行业报告显示,英国政府通过高效的使用公共大数据的技术每年可以节省330亿英镑,相当域英国人每人每年节省500英镑(约每人每年节约5000人民币)。
 

另一件事也很惊人,美国哈佛大学肯尼迪学院的学生到清华大学经管学院去交流。清华让他们分析中国政府管的那些事儿。然后问肯尼迪学院的学生“你们猜猜中国中央政府有多少官员?”有人猜200万,很多人猜400万,还有人猜1000万。实际上我们国家中央政府才5万人!这说明什么问题?这些人不是小学生中学生,他们是肯尼迪政府学院的,在他们看来,中国这些事需要几百万一千万人来管理。五万人管,不是说我们效率高,而是说很多该管的事情没管起来,政府治理不到位治大国要有大智慧,智慧来源应该是数据,而不是主观臆断。我们要反对官僚主义形式主义。大数据时代数据也不仅仅是工具,也是战略,也是世界观,也是文化。大数据将带来一场社会变革,特别是公共管理与公共服务领域的变革。今天发布的新书《智慧政府》里面就有这句话,我附和下这个观点。
 

人是数据总和的概念。大家知道现在谷歌这个公司,还有瑞士的公司,他们现在招人,基本上不需要你填简历表。因为他们从你的平时参加什么会,交流什么情况,他从网上都可以搜索到你的这些东西,他基本上把你这个人的水平、在什么档次上,就刻画出来了。他有一个虚拟的人才库。所以他需要招什么人的时候,都去这个库里去找。在大数据时代,在数据构成的世界,一切社会关系都可以用数据表示,人是相关数据的总和
 

每种数据来源都有一定的局限性。只有融合集成各方面的原始数据(所谓“带毛”的数据),才能反应事物的全貌。事物的本质和规律是隐藏在元素数据的相互关联之中。这就是相关数据的总和,各方的关系都能反映出来。不同的数据可能角度不同,但是描述的是同一件事情。政府的数据可能更客观事实,网上的数据可能是主观的民意。对同一个问题,不同的数据可以反映不同的互补信息,增加了解。这就是大数据它的作用,它是集成各方面的信息。
 

我早年和钱老(注:钱学森)有过接触,钱老提倡“大成智慧学”,把这个翻译成Wisdom in Cyberspace90年代的时候他就是这么翻译的。“必集大成,才得智慧”,一定要集。有了数据、信息,才能出智慧。必须是很多很多数据。大数据并不是说数据量很大就行,而是说各方面的数据,种类很多,很杂,在一起,总量很大,才叫大数据。所以这个不同数据是个复杂系统。大数据在复杂系统中看起来大多是些“零金碎玉”没什么逻辑,很杂乱的,它不一定能用现在的科学技术能够解释,所以有些东西属于钱老讲的前沿科学,大数据现在还是个不成熟的科学。
 

解放战争时期,我们国家搞土地革命,打土豪分田地。让人们耕者有其田。孙中山那句话怎么讲的,民主革命,有了这一条我们的解放战争才能得到胜利。改革开放初期,凤阳农民搞承包,也是耕者有其田,才取得农业发展,带动全国改革开放。这里面都有一个前提,就是属于老百姓的财产,让他有一个管理权,他自己去管
 

现在是大数据时代,作为公共财产的政府数据,本质上属于全国人民,如果让这些数据回到人民群众中去,当然要在保障国家安全、保护个人隐私与企业商业秘密的前提下,其作用就像当年实行的“耕者有其田”一样,是生产关系的一个大变革也会促进生产力的大解放。
 

现在问题是很多人不承认这个理念,不赞成“耕者有其田”。比如一些部门拿国家的钱,老百姓税收的钱采集上数据后,就认为这些数据归他们各自部门所有。实际上这个数据的所有权应属于老百姓。像互联网公司,比如百度、腾讯虽然拥有很多数据,但是一般不会免费开放,只给自己公司用。
 

目前支持大数据产业的数据来源主要靠政府。有些人担心数据开放后有什么用?其实不用担心政府开放的数据没有人用,开放数据后,众多的中小企业会创造出各种各样的数据应用,形成过去没有的生数据态链。像纽约,数据公开后,2年时间内,就有500多家企业来做数据相关服务。

刚刚讲的“政府开发数据”、“公共部门信息”和“大数据”还不完全相同,关系如下图所示:

 

“政府开放数据”应该占“公共部门信息”的大部分,“大数据”是个公共概念,不单指政府数据,还有企业数据。比如在华大基因,这家公司已经把测试个人基因图谱的费用降到1000美元以下,以前要几万甚至几十万美元。一个人的基因测序加上基因分析数据大概为1TB,为100万人做基因测序的数据量就达到1000PB(1EB)。纽约市的开放数据平台不到两年,已经有2090组数据上线,新产生的移动应用已有几百个。到2016年,中关村要培育500家大数据企业,建成10个以上行业大数据应用平台,带动产业规模超过1万亿元。之前我参加贵州省论证会,2020年贵州省的大数据产业到4500亿。虽然我不建议使用“带动”这个词,因为这个“带动”是无法考核的,所以我建议国家做规划时,少用“带动”这个词。但不管怎么说,能体现数量级的概念,能够激励信心。

政府共享的数据分为三类:

(一)面向操作业务的信息共享。这种共享是为办事人员设计的,办理银行贷款时要查信用数据库;办理出入境手续时要查局级干部名单表;办理税务业务时要查上家的增值税。现在政府部门出台的政策,讲的开放数据,主要指这部分。不管是广州、上海、宁波,讲的开放数据,大部分指这类,是政府各部门之间办公流程所需要的数据。

(二)面向管理的信息共享。使用这种共享数据的大多为各项业务的管理者。管理者需要及时看到业务各方面的运行状态,便于及时控制、调整及记录数据以备查

(三)面向研究和决策的信息共享。使用这种共享主要是政策研究人员、主管官员和企业领导。这种信息共享的作用是发现知识、总结规律,从数据中发现新知识、新问题,制定新政策,更需要大数据

目前我们还处在阶段一,从一到三还有很长的路要走。

 

国外提出的政府开放数据的原则:

1.完整性:没有隐私,安全或特权的限制

2.原始性:数据收集来源有最高的粒度级别,不是聚合或被修改的形式。

3.及时性:数据能根据需要尽快获得。

4.可获取性:数据能提供给最广泛的用户和最广泛的用途。

5.可处理性:数据结构合理,允许机器自动处理。

6.非歧视性:数据可用于任何人,没有注册登记的要求。

7.非专有性(Non-proprietary):不受独家控制

8.非许可性(License-free):数据不受任何版权、专利、商标或商业秘密控制

这些更多的指“知情权”,群众、公民有了解信息的权利。


 

李院士的课题组,提出政府开放数据的六项原则:

开放原则:政府信息资源以共享为原则,不共享为例外。注意开放与保护隐私的平衡。

保障安全原则:根据安全等级确定数据共享的范围。

价值导向原则:开放的政务数据资源应具有经济价值和社会价值,共享的目的是促进数据资源的利用。

质量保障原则:内容完整可信,数据格式方便使用,内容及时更新

责权利统一原则:政务数据拥有部门承担数据开放的责任,依法明确可开放数据的范围。用户对下载后数据的使用行为负责。

数字连续性原则:被开放的政务数据资源应维护其数字连续性,可检索、可呈现、可理解、可被发现,保证可持续再用。

 

举个例子,在某市《政府信息资源共享管理办法》中,写到“行政机关未经提供信息的行政机关同意,不得擅自向社会发布和公开所获取的共享信息”。如果是无条件开放的数据,为什么不能再公开。对于“无附加条件共享”的政府数据,应实行“非限制即共享的原则”。又写到“行政机关要求获取的共享政府信息属于政府信息共享目录之外的,信息化主管部门应当提请同级人民政府做出决定”。这些立法的指导思想是规定你能共享什么你才能获得什么信息,不是规定你不能获得什么,其他的数据都可以获得。需要考虑从“管理”到“治理”的转变。应考虑如果在已有“目录”外有新的数据出现,如何迅速处理。不及时批准能否共享,就无法共享和开放。

 

评价政府开放数据的5维度框架

  • 政策与立法:相关的立法文件和政策;政府数据共享的程序和标准
  • 技术:共享数据格式的规范程度;数据质量如何;数据是否通俗易懂;数据更新和维护水平等
  • 管理架构与组织形式:监督和合作机制是否恰当,是否明确谁承担保证数据质量的责任;是否提供激励机制让公共部门提供数据(包括对公务员的激励机制);是否明确谁承担费用,维护政府开放数据的金融机制和费用模式等。
  • 沟通交流:政府开放数据是否形成良性的生态系统;企业界的支持程度;公众对政府开放数据的兴趣;反馈渠道是否畅通;公众对政府开放数据的满意度等。
  • 效果和效益:政府数据共享产生的经济效益和社会效益;数据共享对政府本身工作效率的提高等。

 

举两个例子,美国着重技术层面的开放数据评价体系,主要评价参数是

  • 网站表现(总访问量,平均访问时长,等等)
  • 用户满意度(用户推荐率,用户返回率,等等)
  • 搜索指标(第一关联商业搜索引擎,第一搜索关键词,等等)
  • 用户体验
  • 移动端指标

 

日本则是基于具体领域的开放数据评价体系,从企业、民生、公共服务三个角度设立开放数据的KPI

 

 

最后,综合以上几个考核点中,摘出几条我们任务特别重要的:

(一)共享数据应以公众需求为导向。

数据开放的“目录”不是登记政府现有的数据,而是要按照群众的实际需要编写“目录”,按需求归档。美国在政府信息化建设中坚持“以公众需求为导向”的理念,美国联邦政府在电子政务建设中提出了“让人们点击3次鼠标把事情办完”的口号,减少企业或老百姓与政府部门打交道的时间和成本要使公众真正成为政府信息化主角,促使政府从内部进行变革,实现全民政府的理想,公众的需求将成为未来政府信息化发展的原动力。德国政府的“让数据而不是公民跑路”等都充分体现了“以人为本”的服务理念

 

(二)重视数据共享的成本

信息共享一定要算经济账,不是共享信息越多越好。共享一定能带来信息化成本的节省。曙光公司在包头市做政府数据共享,节省50%成本(节约1亿元),信息化进度加快5年以上。信息共享在给共享方带来多种收益的同时,也带来了相当的成本支出。信息共享的方案设计是实实在在的经济选择问题,经济上不合理的信息共享方案是必定不能持久。应建立一个全面、科学的数据共享评价指标体系,不仅关注数字指标,还要特别重视质量指标。如社会满意度,服务质量系数等。要明确规定评估的程序,秉着真实、客观、公平的原则,对其运转过程中的投入、产出和最终的成果的绩效评定和划分等级。建立科学的激励机制,为信息资源共享提供强大的动力。

 

日本“一体化”政府平台设想

日本提出,20132020年期间以发展开放公共数据和大数据为核心的日本新IT国家战略,把日本建设成为一个具有世界最高水准的广泛运用信息产业技术的社会。日本电子政府在构建之初,并没有考虑到政府系统需要“一体化”的问题,所以产生了大量重复的情报系统,从而增加了公众的负担(需要重复操作申请/申报流程),也增加了运营成本。在2013年《创造世界最先进IT国家》宣言中,日本提出了构建“一体化”政府平台的设想。通过引进金融中“portfolio management(组合管理)的概念和“费用VS效果”的指标,废除大量不必要的情报系统,目标是

1)现有的约1500个情报系统减半(2018年实现);

2)运营成本降低30%2021年实现)。

 

重视政府信息资源开发利用的“效能、效益和效率”

建立开放数据生态系统。美国2000年取消了对民用GPS精度的限制,国内就有约300万的就业岗位依赖于GPS加拿大电子政务建设,连续第五次被著名跨国咨询公司埃森哲评为全球第一。加拿大在组织在线信息和服务时,并不是根据管理机构的职能,而是从公众和企业的需要出发在电子政府信息资源管理过程中,政府将不再大包大揽,更多的将充分依托社会力量,采取外包的方式广泛采取了市场运作的外包模式,进行政府信息资源的商业化开发利用。

应从政府信息资源开发利用后的“效能、效益和效率”(简称“三效”)作出全面、客观、公正的评价,建立一套科学绩效评价体系显得尤为重要。这里要提一个观念问题——数据再利用。国外有数据再利用法,中国没有,中国有个误区,政府开放数据后,政府要再利用,越充分利用越好。实际是错的!政府拿税收收入采集数据,很多国家限制政府再利用,不许政府利用。要求政府必须把数据给公众来利用,因为如果政府再利用数据,政府有近水楼台,有其他数据使用者所不具备的竞争优势,对其他使用者有妨碍。所以美国及很多国家立法,限制政府对数据再利用。我们国家不是这样,很多机构自己要利用。

 

最后归纳一下阻碍政府信息共享的因素:不愿贡献、不敢共享、不能共享

  • 缺乏政府数据共享的理念,对治理现代化认识不足。
  • 缺乏政府数据共享机制的责任主体,怕犯泄密错误,宁可不作为。
  • 缺乏数据共享的法规和制度,无法可依或者法律法规间相互冲突。
  • 缺乏政府数据共享的统一标准和规范,缺乏治理机制设计。

国家对政府数据共享没有合理的财政预算。政府信息资源再利用中收费机制不合理,利益分配不均衡。一些政府部门将政府信息资源产权部门化,设置信息利用的壁垒。以为共享的信息越多越好,提出的信息共享目标不切合实际。信息化基础差,面对跨部门信息共享的需求,心有余而力不足。

政府数据的采集和开发利用投入产出比低,效益低下。

谢谢大家!

 
 
  来源:大数据文摘  

copyright©2004 stanchina.com All Rights Reserved