上篇广东试验

第一章研究概述

本篇为我们第十次发布的“广东省地方政府（市、县两级）整体绩效评价报告”（红皮书，针对2015年度）。本项研究由华南理工大学政府绩效评价中心、广东省政府绩效管理研究会、华南理工大学法治评价与研究中心、原点市场研究机构协同完成，亦被学界称之为“广东试验”。政府绩效评价是公共管理及政府管理创新的前沿课题。一般认为，政府公共项目、公共部门、公共政策与政府整体绩效评价构成现代政府绩效评价的框架体系。从语义来说，本项研究则侧重于事后的“测量与分析”，选择“评价”一词。

一、政府绩效评价及发展

1．绩效、绩效评价与政府整体绩效评价

所谓“绩效”，字面上可理解为“成绩和效果”，源自于企业；可视为通过效率、财务、市场占有率、内部激励结构、企业文化等各种指标来衡量或评价企业行为的过程。绩效概念早先应用于投资项目管理，之后再延伸至人力资源管理、组织管理等领域。上世纪30年代，西方国家开始在公共行政管理领域使用“绩效”概念，形成“政府绩效”的概念范畴。

按照中国行政管理学会的定义，所谓政府绩效，在西方称之为“国家生产力”、“公共生产力”、“政府业绩”、“政府作为”等，是指政府在社会经济管理活动中的效率、效果、效益和效能，亦是政府在行使其职能、实施其意志过程中所体现出的管理和服务能力。评价是指依据质量、效率、能力等指标，对政府在行政管理过程中的投入、产出、中期和最终成果进行综合评定和划分等级的活动。一般而言，评价的对象侧重于组织行为，评价范围既可是全局的也可是局部的，评价时点可分为事先、事中和事后评价。政府绩效评价具有周期性，通常指特定政府一段时间内的结果测定。评价只能针对被评价政府，可以作为或主导作为的行为、过程及结果。

和传统评价有别，绩效评价（管理）取代效率评价（管理）为20世纪政府管理理念创新的重要表现。尽管由于政府的公共属性，目标的多元性，运作的非交易性，带来绩效测量的复杂性，但从导向上看，现代政府绩效评价的核心问题指向“公民满意”和“实现政府责任”。

整体绩效评价是一个全新的概念范畴。所谓整体绩效，相对于公共部门绩效、公共项目绩效、公共政策绩效而言，指一定时期内（如一年）作为一级特定政府的总体“成绩与效益”，包括政府行使职能的各个方面，如经济、社会、教育、文化，甚至司法等。整体绩效本质上类似于“概念绩效”或“印象绩效”，具有典型的“中国特色”。因为从评价，尤其是公众评价的角度，基于作为评价者的公众未必是政府的直接“消费者”，他们的评价只能是“概念”或“印象”评价。正因如此，西方国家较少进行所谓整体绩效评价，这种功能由选票及选举市场来完成。某种意义说，我国与西方迥然不同的社会制度加大了整体绩效评价的难度，但也更加凸现了整体绩效评价在我国实践的意义和迫切性。

2．政府绩效评价的兴起与发展

在西方公共管理运动兴起的过程中，政府绩效评价作为一项有效管理及监督工具得到广泛的研究和应用，它的产生和发展有着特殊的历史背景和深刻的社会原因，历经了若干阶段，表现出不同的特征，呈现不同的作用和功能。

第一阶段始于20世纪70年代，或称为导入期。尽管学术界对现代意义上的政府绩效评价研究实践的伊始时间仍有争议，但普遍以上世纪70年代克莱伦斯·雷德和赫伯特·西蒙出版的《市政工作衡量——行政管理评估标准的调查》一书为奠基的标志。美国先行一步，1973年，尼克松政府颁布了《联邦政府生产率测定方案》，使政府绩效评价正规化、系统化和规范化。1976年，科罗拉多州通过第一部《日落法》，此后再有36个州先后通过类似的法案。政府绩效评价在美国进入了法制化阶段周凯．政府绩效评估导论[M]．北京：中国人民大学出版社，2006:6. 。

经过二战之后20年的高速发展，至20世纪70年代，西方社会发展到新的转折点。一方面，政府管理集权化导致政府垄断加剧，效率低落，官僚主义盛行；另一方面，全面推行“福利国家”、“混合经济国家”的公共政策取向加剧了政府管理失控、机构臃肿的趋向。不断扩大的财政赤字导致政府面临严重的财政、管理和信任危机。戴维·奥斯本指出：“它们（政府）在公共教育上花的钱越来越多，但是学生考试分数差和退学率几乎没有改变。它们在警察和监狱上花的钱越来越多，但是犯罪率继续上升” [美]戴维·奥斯本等．改革政府——企业精神如何改革着公营部门[M]．上海：上海译文出版社，1996:121. 。加之正处于越南战争，美国政府危机此落彼起。联邦政府于1973年颁布了生产率测定方案，设计出3000多个绩效指标，力图从制度上保证政府机构评价的有效性和全面性。在当时背景下，推行政府绩效评价的直接动因及目的是减少财政支出，提高办事效率，摆脱财政危机和公众信誉危机。这段时间内，美国政府绩效评价大都以内部评价方式进行，同时开始通过立法尝试让公众参与评价活动。

第二阶段始于20世纪80年代，或称为发展时期。借鉴企业的做法，以市场化为主要诉求，西方各国进一步对政府传统的官僚体制，尤其是组织机构臃肿、效率低下、思想僵化封闭、规制繁杂、公权异化等已难以适应复杂公共管理领域的运作模式和运行机制进行彻底改造，政府绩效评价由此全面展开；同时，新公共管理思想力主减少政府干预，应用企业管理思想、方法和哲学，对公共部门的投入产出进行科学的测定，将企业人力资源管理中的绩效评价手段应用于政府部门，实现公共效益的最大化。英国具有代表性，从60年代开始对公共生产力进行评定，到80年代在中央和地方各个部门进行持续的大规模的“雷纳评审”，随后又建立了“部长管理信息系统”，旨在及时提供全面的、规范化的信息，重点又是行政活动的直接产出信息。这一方案包括140个绩效指标，首先应用于卫生服务系统，之后，从中央到地方的各级政府部门都建立起了比较完善的绩效评价体系。周凯．政府绩效评估导论[M]．北京：中国人民大学出版社，2006:7.

政府绩效评价“全面而迅速推广”有着较深刻的社会背景，历经凯恩斯主义及二战之后20多年的繁荣，至上世纪80年代，全球资本主义面对新的危机。在20世纪80年代即将结束之时，美国《时代》周刊封面以“政府死亡了吗”为题，提出了“对政府信任一再降到创纪录的最低点”的严峻问题迈克尔·巴龙．美国世纪[N]．参考消息，2000-01-05. 。在美国的“里根主义”和英国的“撒切尔主义”主导西方世界的背景下，来自于政府内部和外部的压力，推动政府绩效评价向纵深发展，评价的目的则是顺应变革潮流，强化行政能力，树立政府威望，用企业家精神重塑政府。这一时期，除了国家权力机关介入绩效评价的立法外，公众通过不同方式直接参与评价活动。

第三阶段开始于20世纪90年代，可视为相对成熟期。20世纪90年代以来，政府绩效评价体系和评估方法更加科学化。1993年，美国第103届国会颁布了《政府绩效及结果法案》（GDRA），以立法的形式确定了政府绩效评价的地位，同年成立了全国绩效审查委员会（NPR）。该委员会要求政府管理必须对本身的绩效评价从法律和制度上予以确认，要求所有的公共机构都要把自己的相关绩效评价，如实地向美国人民报告并接受人民的监督周凯．政府绩效评估导论[M]．北京：中国人民大学出版社，2006:7. 。上世纪90年代以来，除美国和英国外，政府绩效评价在西方及新兴国家都得到了广泛的发展和应用，以至于有西方学者宣称“评估国”已屹立于世界之林。背后的动因，主要是“一场全球性的革命已经开始，以知识为基础的经济全球化时代已经到来，并正在世界各地破坏种种陈旧的现实存在” 张国庆．行政管理学概论[M]．北京：北京大学出版社，2000:649. 。受经济全球化和知识经济对政府管理提出挑战的推动，重塑政府改革运动促进政府自身管理变革，而自身管理改革集中在政府绩效管理上，以实现经济目标、效率目标和效益目标等全新管理模式。这一时期，就政府内部而言，更关注重塑政府管理形象和模式，实现政府管理的绩效导向；从外部环境来看，由社会公众和民间组织组成的第三评价主体出现，实现“体制外”评价。

进入21世纪以来，政府绩效评价更加凸现以下特征：一是评价逐步走向制度化和法制化，如1993年美国规定联邦政府“每个机构应提交年度绩效规划和报告”，财政预算与政府部门绩效挂钩。二是评价主体多元化，公民和服务对象广泛参与评价过程，第三方评价更加普及。三是评价体现公民导向。评价旨在推动建立公共部门负责任的有效机制，以公民满意为评价的终极标准。四是评价技术不断成熟。

二、我国政府绩效管理及评价

党的十八大报告指出，要“创新行政管理方式，提高政府公信力、执行力，推进政府绩效管理”。如果说，2000年福建省推行机关效能建设为中国特色的“政府绩效管理与评价”的始端，那么，之后十余年，从目标考核到科学发展观考评，再到政府绩效管理试点，折射了我国政府管理创新的历程，触及到行政体制改革的中枢。

（一）我国政府绩效管理的目标导向

源自西方政治制度基本框架内的政府绩效管理有着深刻的社会背景及内置的价值导向。作为政府管理方式创新的一种手段，它贯穿了公共责任与顾客至上的管理理念，强化公共服务的结果导向，在追求经济、效率、效果的基础上，全面回应公民祈求，即凸现所谓“公平性”。或者说，政府绩效管理一开始就存在清晰的目标导向，包括价值目标及技术目标。从组织管理的角度，政府绩效管理的价值目标即是民主目标，可视为政府的公信力；技术目标追求政府管治的效率效果，体现政府的执行力。

尽管至2006年，政府执行力和公信力的概念才首次被写进当年的《政府工作报告》，被官方正式纳入国家管理范畴，但事实上，有组织一定有目标，有目标客观上要求有执行力。传统的集权体制本质即是强化自上而下的执行力的体制。所谓政府执行力，源自行政法学领域，是指对具体行政行为予以强制执行的能力或法律效力，可视为政府实施社会经济发展目标的能力，或者是政府“在推动或监督保证既定的公共政策得以落实的过程中，所体现出来的实际能力与手段。” 周永亮．本土化执行力模式[M]．北京：中国发展出版社，2004. 它依附于制度、体制与政府政策，甚至由政治体制及制度所决定。

我们以为，从理论逻辑及现实背景来看，我国政府绩效管理的目标导向与其说旨在提高政府执行力，不如说在于提升政府公信力。这一导向是保障我国政府绩效管理试点工作不走样的前提。

首先，政府公信力指向政府与公民的关系，与政府绩效管理的价值导向一脉相承。所谓公信力（Accountability），简言之，使公众信任的力量。“政府的公信力体现了政府的信用能力，是公民对政府行为持信任态度，是社会组织、民众对政府信誉的一种主观评价或价值判断”。叶育登．信息的透明度政府的公信力社会的凝聚力——从政府对禽流感信息发布工作说起[J]．中国行政管理，2004（4）:56-58. 政府作为提供公共服务的垄断组织，其公信力由公众对其履行职责的程度做出评价。显然，政府公信力涉及公众与政府的本质关系，是政府公共治理的合法性的源泉，也是社会性秩序和权威被自觉认可和服从的性质和状态。按照卢梭的契约理论，国家权力来源于人民与政府之间的协议或契约，政府公信力集中体现了政治合法性的实质内容。同时，政府公信力是社会信用系统的核心和指针，政府信用是其他信用得以存在和发展的基础和前提条件，一旦政府信用流失，社会信用赖以存在平台必然走样。本质上，政府绩效管理是民主文化的技术工具和手段，但它内置了管理的目标应由公民来认同这一“普世价值”，即所谓公众满意是检验政府行为及政策目标的终极标准。

其次，政府公信力必然以政府执行力为前提，体现政府绩效管理的技术功能。“工业化和科技的发展在促进社会进步的同时，也引发了人口膨胀、社会治安、环境恶化等诸多社会问题，政府所面临的公共问题的复杂性、动荡性和多元性环境，导致了政府不可治理性的增加，客观上引发了政府的信任危机”。 [美]乔治·弗雷德里克森等．公共行政的精神[M]．张成福，译．北京：中国人民大学出版社，2003. 尽管公信力是公众对政府的主观评价，强弱程度取决于政府所拥有的信用资源的丰富程度，以及政府及公务员在公民心目中的具体形象。或者说，政府公信力是公众对政府行政能力的满意度。但按照满意度理论，公众对政府行为的主观感知以政府行为的客观效果为前提，没有什么比公众自身更了解需要什么样的政府以及政府的服务，但任何主观评价总是基于公众已知的客观事实，这一“事实”，不论是政府的诚信程度、服务水平，还是依法行政能力、民主化进展，都可视为政府执行力的体现，换言之，政府公信力总以政府执行力为基础。理论上，没有政府执行力就没有政府公信力，但执行力与公信力并非平行的概念。政府绩效管理所追求的公信力内置了执行力。作为组织管理，政府管理奉行职能主义，始终将执行力视为内生目标。政府绩效管理是政府管理的创新，它所推崇的“4E”模式中，效率与效果本身就是技术目标，亦是政府执行力的重要衡量指标。

最后，政府绩效管理指向政府“应该干什么”，一定程度上可对政府执行力进行纠错。政府执行力属于技术范畴，它是政府决策及实现目标的执行能力，隐含了决策及目标的正确性，但事实上，决策失误或政府公共政策“坏倾向”具有自发性，对决策纠错是民主的理由与功能。我国政府管理及社会存在的问题，大都与目标本身或目标导向有关，因为体制内管理及评价必然指向政府“正在做什么”，并非“应该做什么”，充其量是政府执行力，并非“服务公民的能力”。比方说，普遍存在的重复建设为政府执行力异化的典型表象。这种执行力等同破坏力，并与公信力成反比。由于体制内管理及评价更多强调政府的行为过程，或者说，更多注重于政府的现状职能的实现程度，主要又是对上级政府目标的完成状况，在我国现有体制下，上下级政府职能之间具有传承性；体制内管理及评价内设上级政府的正确性，难能形成政府“应该做什么”的纠错机制。由此导致“长期以来，自上而下的政绩考评标准，是以GDP增长为核心的评价考核体系。这样的政绩考评有着显而易见的缺陷，甚至在很多情况下，不少地方政府政绩‘显赫’，但当地百姓却苦不堪言”的现实窘况。政府绩效管理与评价彰显公众满意的结果导向，可有效纠正过头或反向的“政府执行力”，从而为政府的理想职能、竞争方向、变革预期等抽象议题增添新标准，强化政府的公信力。

（二）我国政府绩效管理的功能定位

一般认为，政府绩效管理是指改进政府管理组织和管理项目的生产力。20世纪70年代以来，基于政府的职能定位，以公共选择理论、新制度经济学等为理论支撑，政府绩效管理被视为重塑政府的另一版本，并呈现公共生产力变革、创新管理机制与手段、强调行政投入产出的测量与监控等特征。政府绩效评价是政府绩效管理的中心环节，被视为现代政府管理的前沿课题，具有计划辅助、预测判断、监控支持、激励约束、资源优化和体制创新等多项功能。作为一种运行机制和技术工具，应该说，政府绩效管理及评价一开始就存在清晰的功能与定位。但我国社会条件与现实状况与西方迥然有别，基于党政以及党政领导与党政组织的特殊关系，即或是对“政府”的界定，我国与西方亦差异明显，加之整体上处于社会经济的剧烈转型期，政党、政府、公民与社会的新型关系尚在培育之中，此种背景下，如何界定我国政府绩效管理及评价的功能与定位决定了学术研究的走向与试点工作的边界。

1．政府绩效管理是我国政府管理创新的基本路径

管理创新是新时期我国政府管理变革及建设服务型政府的必然选择，亦是行政管理体制改革的重要组成部分，涉及到观念意识、职能定位、机构设置、组织设计、管理方式与工作流程等内涵，但核心在于坚持以人为本和公平正义的价值原则，驱使政府转变单向的权力主导式的行政模式，尊重公民对于公共产品的需求偏好和意见表达；换言之，在奉行职能主义，崇尚法治与科学精神的科层制度与组织的基础上，拓宽公民参与渠道，培育公民参与主体。“从60年代算起的20～50年里，人们将目睹并亲自参加官僚制的送葬队伍。” Jay Mishafritz, Albert C, Hyde.Classics of Public Administration[M].Chicago: The Dorsey,1987:325. 因为政府管理是人民当家作主的管理，科层制与此背道而驰。

政府绩效管理是新时期我国政府管理创新的基本路径。原因在于：

一是价值层面上，政府绩效管理体现民主文化的基本导向。民主为普世价值，“行政权力的受任者决不是人民的主人，而只是人民的官吏；只要人民愿意就可以委任他们，也可以撤换他们” 卢梭．社会契约论[M]．北京：商务印书馆，2002:132. 。在中国特色社会主义民主理论体系中，没有民主就没有社会主义及其现代化，人民民主是社会主义的生命。新时期我国政府管理创新，不论何种路径，民主是绕不开的方向。政府绩效管理的内在机理和运行逻辑与现代民主政治的发展一脉相承。一方面，它增强了政府实质合法性；另一方面，它凸显了政府管理民主化。马克·彼特拉克认为，公民参与是民主的希望。马克·彼特拉克．当代西方对民主的探索：希望、危险与前景[J]．国外政治学，1989（1）. 民主行政和公民参与紧密相连、不可分割。公民参与的程度是衡量政府管理民主化程度的重要标准，是否民主，不在于人民是否直接行使公共权力，而在于其是否将公共权力置于人民的制约和监督之中。同时，政府绩效管理是实现社会主义“增量民主”的现实路经。在民主的路径上，增量民主是“在不损害人民群众原有政治利益的前提下，迅速、最大限度地增加新的政治利益” 俞可平．增量民主有三条现实路径[N]．南方都市报（A10版）,2007-02-21. 。它是一个稳定的发展过程，也是长期改革积淀的结果。政府绩效管理的民主导向与社会主义条件下的民主方向具有一致性，即公民参与及监督政府的一致性，为社会主义的民主路径。

二是技术层面上，政府绩效管理是实现政府理想职能的工具体系。源自西方的政府绩效管理，是在宪政民主的架构下，主要从技术层面解决政府效率、效益、效果和公平的问题，指向公共生产力。基于“顾客至上”的时代背景以及公共事务的复杂性，传统管理理念与手段难以为继，从历史来看，可以将20世纪八、九十年代持续20年的西方国家政府绩效化运动视为发达资本主义自我调整的重要内容。这种调整虽以西方选举市场为基础，但却以政府的技术功能实现为目的。在我国社会制度与西方迥然不同的现实条件下，政府绩效管理的工具属性更易凝聚共识，成为可能操作的政策方案。可以肯定，基于民主导向和技术工具的双重属性，政府绩效管理必然成为民主道路上我国政府管理创新的基本路径。

2．我国政府绩效管理的现实定位

如果以提升政府效率为目的，我国政府效能建设可以追溯到建国初。虽然效率是绩效的组成元素，但学界普遍认为，我国政府绩效管理发端于本世纪初，到2011年，全国约有三分之一的政府及部门不同程度地探索开展此项工作。我们搜集到的冠以所谓绩效模式的地方政府就有上百个，如与目标责任制相结合的“青岛模式”，将公众和服务对象的评议纳入绩效内容的“杭州模式”，最早提出与开展“政府绩效管理年”（2007）且实现智能化的“深圳模式”。但审视各地官方的管理办法或条例，均未对政府绩效管理定位有着明晰的界定，这样的后果，模糊了绩效管理与已有的管理、绩效评价与已有的考评的界线。我们以为，从现实出发，我国政府绩效管理的定位是“绩效导向下的目标管理”。

一是目标管理。1954年，彼得·德鲁克（Peter Drucker）提出“目标管理”理论被誉为“管理中的管理”，它以目标为导向，以人为中心，以成果为标准，从企业管理迅速延伸到其他组织和个人管理中。作为方法论，目标管理目前已经成为中国各级政府管理最常见有效的管理模式。尽管政府目标具有多元性，但实现各项目标是执行力体现，是集权体制的优越性所在。政府绩效管理立足于目标管理首先吻合体制内自上而下的管理属性。层级体制下，完成上级政府制定的目标是本级政府的使命所然，政府绩效管理倘若无助于目标实现，必然与政府内部管理的刚性需求相脱节，从而丧失存在的前提，尤其是各级政府中心及重大工作的完成，关系到主要官员的政治生命，目标管理因权、责、利清晰对称而成为最有效的管理方法。同时，目标管理也是绩效管理的内在要求，经济、效率与效果均针对目标而言的。

二是绩效导向。严格意义上说，冠以绩效管理的当前我国各级政府的内部管理本质上即是目标管理，如果以目标管理作为我国政府绩效管理的定位不仅逻辑上“多此一举”，而且会打乱组织内部原有的平衡，增加管理成本，丧失其应有的意义。绩效导向为目标管理设置了方向和条件，首先是“结果导向”，指向组织内部关系。结果与过程具有相对性，目标管理某种程度上亦体现结果导向，但这种结果往往是短期或主要领导人的“任期结果”，与组织长期目标未必一致，甚至背道而驰，绩效管理追求政府目标长期最大化。其次是“公众满意导向”，指向组织内部与外部的关系。政府目标多元性，运作非交易性，行为效果滞后性等特征决定了衡量其结果的复杂性，既然政府由纳税人所供养，公众满意成为检验结果的最终标准。事实上，源自企业的目标管理界定了目标关联者（企业与消费者）的关系，但落脚点是消费者选择，政府目标管理亦如此（政府与公众的关系），不过是公众或公共选择。

由此，从现实出发，我国政府绩效管理定位于“绩效导向下的目标管理”不仅强化了组织内部的目标实现及责任，即提高政府执行力，体现政府内部自上而下的管理属性及政治制度的内在要求，更重要是从组织外部的视角，检验内部目标的科学性与民主性，实现政府执行力与公信力的统一，也即是理性工具与价值导向的平衡。

（三）我国政府绩效管理的现实矛盾

一是管理权与组织权的矛盾。政府绩效管理过程涉及管理权、组织权等多重权力关系。在各地成立的政府绩效管理（试点）工作机构中，领导机构是管理的主体，拥有管理权，专设（常设或临设）机构是管理的组织者，拥有组织权。从权力组合与制衡的角度，组织机构应该有超然地位，与管理对象保持距离。但目前组织机构或牵头单位虽五花八门，如纪委监察、组织、人事、综合办公等部门，亦为管理对象，同时，管理信息来源亦源自作为管理对象的党政部门。实际操作中，在信息垄断及不对称的情况下，所谓信息釆集的责任部门拥有部分组织权，绩效管理权被肢解或让渡，这样不仅相互牵制，亦造成角色冲突。事实上，围绕管理组织权的博弈，争取部门权力最大化已为政府绩效管理的现实矛盾。

二是过程控制与结果导向的矛盾。管理始终与过程相关联，过程中体现效率。绩效管理旨在强化效率，但比效率内涵更丰富，外延更为广泛。尼古拉斯．亨利指出：“效率指以最少的可得资源来完成一项工作任务，追求投入与产出之比的最大化。而有效性则是指注重所预想的结果”。尼古拉斯．亨利．公共行政与公共事务[M]．北京：中国人民大学出版社，2002:284. 尽管过程与结果具有相对性，但本质上，绩效管理是结果导向的管理创新。

基于内部管理属性与集权体制需要，我国目前政府绩效管理的理念与做法无不强化对决策过程的控制，具体表现为所谓年度中心工作的执行力控制，冠以绩效管理加强“实时监控、实时纠偏纠错和预期预估”，但中心工作年年有变，从而导致绩效评价指标体系日趋庞杂，缺乏一致性、导向性与稳定性。审视各地的做法，不少地方动辄上百项的绩效评价指标均为“政府或主要领导可控的过程指标”，绩效管理成为“上级政府控制下级政府的理性工具”，甚至是家长式管理的理性工具。这样的后果，不仅成本高昂，亦必然与政府绩效管理的有效性、回应性及结果导向形成矛盾。

三是绩效评价与原有考评的矛盾。政府绩效评价是政府绩效管理的核心环节，亦为难点所在。目前我国行政管理的最大特色即是各自为政，五花八门，不断循环的考评。据不完全统计，地方政府每年接受上级年度考评超过百项，指标几千项。镇级处于行政层级最基层，个案调查表明，每年三分之一的时间与精力应付各项考核、评比与检查，其中考评主体、部门、形式、指标之多，流程之繁不堪重负。如广东省几项综合性考核（（组织部牵头的科学发展观考核、发改委牵头的幸福广东考核、省府办牵头的珠三角规划纲要考核、省财厅牵头的基本公共服务均等化考核、省政法委牵头的平安广东考核、省委宣传部牵头的学习型组织考核），大部分指标是重复或相近的（值得一提的是，2013年4月，广东大规模清理考核检查评比表彰项目，省级459项考核评比只保留33项）。虽然体制内各自为政，碎片化的重复考评的原因复杂，但归到底在于：一是“以考代管”，以考评驱动目标完成；二是争取部门利益最大化，考核评价权是最直接、有效的行政权，在现行体制下，评价组织权意味评价主动权；三是成为回避责任的有效手段。将考评作为过程管理的“法定”程序，一旦出现问题，即可“正当”推诿。政府绩效评价是増加一项新的评价，还是统筹原有的考评面对着深层矛盾，背后是现行体制下部门间的评价权之争。

四是统一性与差异性的矛盾。以政府绩效评价为例，评价体系的统一性与被评对象差异性的关系。政府绩效评价本质上是比较性评价，置于现代政府的层级结构中，只有对一组同层级的政府（部门）加以比较评价才有意义，即所谓评价的统一性问题，但基于客观原因，或者说被评价政府不可作为的因素，即使是同级政府所在区域，社会经济及行政文化等亦迥然不同（政府部门之间更是如此），造成所谓差异性问题，这一矛盾成为影响政府绩效管理及评价体系，尤其是指标体系科学性、公正性的难点。

（四）实现“三个统一”是我国政府绩效管理的现实选择

“顶层设计”是一项战略性、全局性设计，本质上取决于政治体制改革的决心与进程，但具体到政府绩效管理，顶层设计指向两个核心问题：一是目标与定位。政府绩效管理源自目标管理，但超越目标管理。理论上，政府绩效管理可视为上级政府控制下级政府的理性工具，但更是公众“控制”政府的理性工具，如何兑现人民满意，提升政府公信力是问题的核心。我们知道，效率提高是执行力的保障，它主要依靠制度的刚性规范，政府绩效提升却有赖于人民认同。当然，我国政府绩效管理的定位不能脱离现实条件，尤其是制度边界，本质上是目标管理，但目标设定与目标检验应以“人民满意不满意”为依归，因此，必须从理念及技术上体现结果导向和人民满意度导向，类似于企业内部目标管理最终由外部的消费者选择来检验一样。二是“三个统一”，即“统一管理组织、统一技术体系及统一结果应用”。统一管理组织核心在于正确处理管理（评价）主体与管理（评价）的关系。目前各自为政的重复考评表面上管理及评价主体是统一的，但组织权分割于不同部门，体现不同部门的意志。统一技术体系（周期、指标、权重、指标评分）关键是处理好技术体系统一性与被管理对象差异性矛盾；统一结果应用是统一管理组织的客观要求。

“三个统一”符合管理学的基本原理，切中现实问题。就政府绩效评价来说，理论上，有权力评价政府绩效的包括内部主体与外部主体，前者属内控管理，必然统一评价权于上级政府，无需要“多头评价”，以减少不确定性，“组织的一个最基本的功能是吸收不确定性造成的影响。” 雷蒙德·E·迈尔斯，查尔斯·C·斯诺．组织的战略结构和过程[M]．北京：东方出版社，2006:314. 本质上，我国政府绩效管理试点工作属于体制内管理创新，统一管理及评价权，由此统一技术体系与结果应用是体制性要求，有利于提高权威性，降低内耗，提升效率。同时，“三个统一”是对各自为政的校正，切中了目前重复考评的现实问题。

但“三个统一”直指体制中枢，面对的阻力不言而喻，为此，一是从长远来看，应将政府绩效管理的管理权及评价权相对独立于政府及其部门之外，对人民代表大会负责，理论上，政府作为评价对象不应该成为评价主体；二是以绩效管理统筹政府管理方式，尤其是以绩效评价统筹已有各种考评，如广东佛山市一样，现有的104项考评中，将“一票否决”式少数考评项目作为资格考核予以保留，将少量的综合性考评纳入绩效评价的范畴，不再单独进行，取消大部分属于部门内部管理中“以考代管”性质的考核；三是建立全国绩效评价的通用模型，在评价指标结构及体系中，以符合绩效内涵、纵向对应、方便操作为原则，设立涵盖经济、社会、环保、成本、公众满意度等维度的统一、简洁的三级指标结构。三级指标统一，部分三级指标对应的具体指标，各地各部门可自主选择，充分调动被考评单位的自主性、能动性与选择性；四是规范结果应用，统一协调目前分属于组织、人事、纪检等部门的奖罚权限，体现政府绩效管理的目的旨在提升政府绩效。

三、独立第三方评政府整体绩效：本项研究特征与审视

（一）基本特征

始于2007年的本项研究被学界称之为“广东试验”。从组织权获取方式的角度，学术界把第三方评价分为委托第三方评价和独立第三方评价两类。第三方评价避免了政府内部评价角色重叠的矛盾，过程公开透明，结果相对客观。它的意义在于：一是直接影响政府行政模式和治理理念，突破官本位、权力本位的管理模式，驱使政府及其公共政策以公共服务质量和公众满意度为导向，体现“民意”祈求；二是推动政府职能转变。评价改变政府自身缺乏转变职能的动力机制，并通过不断的沟通和反馈，促使政府职能体系配置合理化、科学化；三是强化公民价值取向，开辟公民参政议政途径，提高公民的参政意识和与政府对话的能力。

经过30多年改革开放，我国正处于剧烈的社会转型期，广东具有代表性与前瞻性。由政府主导的高速增长的经济模式面对利益关系的重大调整，无可避免地产生政治结构变化的要求。“欠发达国家的大幅度经济增长可能需要在现有的物质技术，甚至在政治结构和社会结构方面做出较大的改变……对于今天大多数欠发达国家来说，看来很有可能的是，它们还要为建立与充分的经济增长相适应的有效的政治体制进行长期的试验性斗争” 郑方辉，李振连．评地方政府整体绩效：社会经济转型背景下的“广东试验”[J]．当代世界与社会主义，2008（5）:128. 。亨廷顿亦有类似的观点，现代政体区别于传统政体的关键乃在其民众政治意识和政治介入的幅度，“如果要保持政治稳定，当政治参与提高时，社会政治制度的复杂性、自治性、适应性和内聚力也必须随之提高”。亨廷顿．变化社会中的政治秩序[M]．上海：三联书店出版社，1989:73. 事实上，“广东试验”实证研究成果表明，广东社会经济转型呈现一系列重要特征，如收入与收入满意度的倒U型雏形初现；生态环境成为发展战略中最稀缺的生产与生活要素；社会保障、治安、教育与医疗等“民生供给”缺失；区域发展三级梯度平衡演变为两极格局，等等。

“广东试验”是新世纪以来，我国政府绩效评价的理论研究、实践探索与广东社会经济转型对政府管理创新需求相结合的产物，“而在目前这样一个选举机制还不尽成熟，投票压力尚不尽完善的年代，通过社会评价的方式施加对政府政策的影响，就成了一种最可常规执行的公民政治参与方式” 唐昊．红皮书是有益的社会评价体系[N]．羊城晚报（A2版）,2007-11-14. , “广东试验”的内涵和特点体现于以下几个方面：

一是独立的第三方评价。并非由政府及隶属部门组织实施，进一步说，由高校学术团队自选题目，独立操作，体现真正意义上的第三方评价。

二是基于公众满意导向，重构评价理念。依据“民主政治、市场经济、法治社会、科学发展、有限有效”现代政府治理理念，界定政府职能定位，在评价政府现状职能的实现程度的基础上，引导政府的职能转换。

三是针对整体绩效，有别于政府部门绩效、项目绩效和政策绩效；立足增量（一定时期内因政府或政策行为带来社会经济的变化量），兼顾存量，形成年度整体绩效指数，与区域竞争力评价形成差别。

四是覆盖全省所有的市、县两级政府。包括21个地级以上市和121个县（市、区）。由于历史原因，广东可划为四大区域，其经济基础、文化传统、行政权限、社会结构等方面存在明显差距。研究将异质特征较为明显的被评对象置于了统一的评价体系中。

五是优化评价路径，使独立的第三方评价变得具有操作性。基于体制外的各种约束条件，在获取完整数据相对困难及研究资源有限的情况下，作为层次分析法特例建立评价指标体系，以主观指标与客观指标相结合的思路弥补统计数据不足或失真。

六是定期公开评价结果，对全社会负责。每年度通过媒体公布结果，形成“公众参与动力——政府感受压力——产生改进绩效需求”的激励与驱动机制，达成政府提高绩效的目的，与委托评价及体制内评价形成差异。

简言之，独立第三方评价与政府整体绩效评价是“广东试验”的两大特征。政府整体绩效评价具有典型的中国特色。现代西方民主宪政下，政府由选民投票产生，几乎每一项公共政策必须体现民意导向，民意投票贯穿了政策产生、执行和结果的全过程，这样，政府绩效评价的逻辑源头即是建立于民意导向下，政府及决策既要对过程负责，更要对结果负责，但说到底是对选民负责。这种背景下，整体绩效评价的功能更多体现于“技术”层面上，无须改变或试图推动政府职能转变，但我国的情况却不尽然。30多年市场导向的经济体制改革，目前到了政治及行政体制不改难以为继的拐点，其中最为现实的改革策略和突破口是推动政府职能转变，显然，政府整体绩效评价可从中扮演重要的角色，甚至成为外在的推动力量。从这个意义上说，“广东试验”是一项中国式“民主试验”。

（二）评价主体：伸张了人民评价政府的权力

评价主体、评价意义和指标体系是政府绩效评价中备受关注的三大议题。一般认为，评价主体决定评价的公信力，大体可以分为内部评价和外部评价。前者是指由政府内部的机构与人员对政府绩效进行测评，后者独立于政府之外。第三方评价是外部评价主要形式之一，可视为由与政府无隶属关系和利益关系的第三方组织实施的评价活动，具体又分为委托第三方与独立第三方评价。

“广东试验”作为国内首家独立第三方评政府整体绩效的研究，秉持超然的态度和理念，使评价结果更加趋于客观公正。“第三方主体的加入是加强政府绩效评估客观公正性的有效途径，而评估主体的独立性则是保持这种客观公正性的基本前提。” 金竹青等．中国政府绩效评话主体结构特点及发展建议[J]．国家行政学院学报，2007（6）:30-33. 由于第三方组织独立于政府系统之外，立场超然，与政府组织没有隶属关系和利益关系，这种“不相关性”使其评价过程可以避开政府的压力和干预，也不用掩饰政府的错误，从根本上克服了政府内部评价双重角色的矛盾。

理论上，评价就是一种权力。评价主体居于权力关系的核心位置。在公民与政府关系中，独立第三方评价主体伸张了人民评价政府的权力。

一是知情权。一般认为，公民知情权是指公民获取政府相关信息而不受公权力妨碍与干涉的权利以及向国家机关请求公开有关信息的权利。具体包括公民的立法知情权，行政知情权和司法知情权。对政府知情权为公民知情权的核心内容，但我国“官本位”思想根深蒂固。一方面，政府及其官员往往会从自身的利益出发，以各种理由限制政务公开，妨碍公民获取政府信息，政府对信息的垄断导致信息资源的巨大浪费；另一方面，公民知情权缺乏具体明确的制度保障，公民缺乏获取政府信息的有效途径，使得知情权局限于一种抽象性的权利。“广东试验”独立于体制外，评价过程公众广泛参与，评价结果向社会公开。

二是监督权。尽管《宪法》明确规定公民对于任何国家机关和国家工作人员，有提出批评和建议的权利，但事实是行政权位居立法权和司法权之上，后两者对前者的有效制衡有限。孟德斯鸠说过，人对权力的使用是没有界限的，如果不加以限制就会滥用权力。个人如此，政府组织亦如此，因此，对政府行政权加以有效监督和约束是公民的权力与责任。理论与实践证明，监督强调外在的强制性，仅有同体监督（即内部监督）而没有异体监督（即外部监督），就会使监督形同虚设。以独立第三方评政府整体绩效的“广东试验”，评价过程就是公众外部监督政府的过程，评价结果为社会公众、社会组织、新闻媒体监督政府，行使监督权提供了可靠依据，彰显了人民当家作主的地位。

三是主导权。体制内的评价是由政府及其隶属部门组织实施，一般自上而下。政府机构及其官员即扮演“运动员”又扮演“裁判员”的角色，“谁来评、评什么、怎么评”全部由政府部门根据自己的利益取向来决定。整个评价过程公民较少参与，评价结果也较少向社会公开。显然，体制内评价的主导权完全掌控在政府手里，这样的后果是“不可避免会放大成绩，或把问题归咎于客观原因，甚至隐瞒实情以逃避责任” 郑方辉，毕紫薇．第三方绩效评价与服务型政府建设[J]．华南理工大学学报（社会科学版）,2009（4）:34-36. 。“广东试验”不然，评价的主导权在民间，“来自民间、面向民间、服务民间，不是政府的附属机构，其合法运作不受政府的干预” 郑方辉，毕紫薇．第三方绩效评价与服务型政府建设[J]．华南理工大学学报（社会科学版）,2009（4）:34-36. ，突破了体制内评价“报喜不报忧”的瓶颈。或者说，评价的主导权转移到了坚守民间立场的第三方评价机构手中，由公众给出政府绩效的“成绩单”。

四是选择权。“在资源能够自由流动的条件下，当政府提供的公共产品和服务价格过高或者不能满足其成员需要时，其社会成员就会像私人物品的消费者挑选私人物品的供给者那样，去挑选适合自己需要的公共产品的供给者—其他政府。当其社会成员有权改选政府时，提供劣质公共产品的政府必然被淘汰，即所谓‘用手投票’，这是政府更迭的根本原因。当其社会成员无权或未能改选政府时，他们就会选择其他区域的政府，即所谓‘用脚投票’” 郑方辉，毕紫薇．第三方绩效评价与服务型政府建设[J]．华南理工大学学报（社会科学版）,2009（4）:34-36. 。“用手投票”和“用脚投票”是公民选择权的直接体现。在西方，政府整体绩效评价等同于选举市场。“广东试验”中，独立第三方对政府整体绩效的评价结果，是公民对政府意愿的综合反映，不但为公民提供了一个评价官员的载体，亦可视为给公众一项选择政府的权力。

（三）评价指向：政府“应该做什么”

整体绩效评价预设了特定条件与约束边界。逻辑上，要评价政府整体绩效，隐含“为什么要评价”、“谁来评价”的前提；进一步，政府整体绩效“应该评价什么”，或者说，什么是我国政府整体绩效的要素结构？

厘清和界定政府职能是评价政府整体绩效的前提。100多年来，围绕政府的角色定位，或者说权力边界及其职能内涵，理论界的争论不绝于耳。然而，即便是“市场经济和法治社会的坚定捍卫者”的哈耶克亦认同需要一个“有限的法治政府”。事实上，近代史表明，任何国家的经济与社会都离不开政府职能的行使。问题的症结在于政府“该干什么”，就如世界银行发展报告（1997）所说的那样：“全球经济具有深远意义的发展使我们再次思考关于政府的一些基本问题：它的作用应该是什么，它能做什么和不能做什么，以及如何做好这些事情。”对此，世界银行发展报告指出，“有5项基础性任务处于每个政府使命的核心地位，如果这5项任务完不成，就不可能取得可持续的、共享的、减少贫困的发展：建立法律基础；保持非扭曲性的政策环境；投资于基本的社会服务与基础设施；保护承受力差的阶层；保护环境” 世界发展报告．变革世界中政府[M]．北京：中国财政经济出版社，1997:1-4. 。

在我国开展第三方评价地方政府整体绩效直接影响政府行政模式和治理理念。突破官本位、权力本位的管理模式，驱使政府及其公共政策体现“民意”祈求，更重要的是推动政府职能转变。第三方评价改变政府自身缺乏转变职能的动力机制，通过不断的沟通和反馈，促使政府职能体系配置合理化、科学化，改善“缺位、错位、越位”普遍现象。众所周知，我国地方政府绩效评价的传统方式，侧重落实目标管理责任制，针对改善政府及行业服务质量的目标，一般由审计机构采取管理及效益审计，或者以效能建设为主要内容的评价等方式。这些模式一定程度上吸收了民间意见，但仍为政府主导，不可避免出现所谓“报喜不报忧”等现象。基于我国地方政府体制高度的封闭性和单向性特征，经验表明，依靠自上而下的体制内监督来提升政府绩效和公众信心的作用相当有限。由第三方对地方政府整体绩效评价，一旦“公布结果，地方政府就能够对照不足加以改进” 李惠武．民间报告排名政府成绩，国内首评县域政府绩效[N].21世纪经济报道（A7版）,2007-11-16. 。

有什么样的考核评价制度，就有什么样的政府行为。我国地方政府存在一系列问题，大都与评价机制和体系有关。自上世纪80年代中期以来，源自地方政府之间强大的竞争压力与自身利益的驱动，加之上级政府政绩考核导向，地方政府将主要精力放在发展地方经济上，但由于市场机制自身并不足以实现所有的经济职能，政府不可避免地卷入经济资源竞争的中心地位，偏离“守夜人”和裁判者角色，并且漠视经济发展中的环境、社会公正等问题。要改变此种状况，必须改变考核制度，包括重构评价组织与主体，重建指标体系，背后的核心问题是体制内评价大都指向政府“正在做什么”并非“应该做什么”，充其量是评价政府执行力，并非“服务公民的能力”。因为体制内考评更多强调政府的行为过程，或者说，更多注重于政府的现状职能的实现程度，主要又是对上级政府目标的完成状况，在我国现有体制下，上下级政府职能之间具有传承性；体制内考评内设上级政府的正确性，难能形成政府“应该做什么”的纠错机制。

“广东试验”基于独立第三方及公众满意度导向，评价直指政府“该做什么”，检验政府“该做什么”与“已做了什么”的成效及差距，也就是政府理想职能的实现程度。具体来说，在经济领域促进竞争，在社会领域捍卫公正，在自然领域保护生态环境，进而将政府职能定位于促进经济发展、维护社会公正、保护生态环境、节约运作成本、实现公众满意，有效融合客观指标与主观指标于一体，贯穿了政府执政为民的价值导向。“广东对官员正实行新的评价指标和考核体系，而华工版（即‘广东试验’）的政府绩效评价体系与此并行不悖。前者作用于内部，是官僚系统的硬杠杠，后者生效于舆论，成为社会观照的软指标。由官员政绩而至于政府绩效，报告所量化的指标显露出行政的动机、行动及成果的社会评价。报告执着于此，自然能产生恒久的推动力。这绝非是对体制内评价的简单补充，它及其凭依的力量是独立奏效的。” 社论．民间评估政府绩效，社会襄助政府变革[N]．南方都市报（A2版）,2008-10-21.

（四）指标体系：终极标准在于人民满意

技术体系，主要又是指标体系决定评价的科学性。“从技术方面来说，绩效指标是关于如何获得考评结果或者如何收集数据而对绩效维度进行操作化界定的一种说明” [美]西奥多·H．波伊斯特．公共与非营利组织绩效考评：方法与应用[M]．肖明政等，译．北京：中国人民大学出版社，2005:86. 。

“对公共管理部门绩效的衡量一直是一个世界性难题”, “广东试验”“作为一项探索性的研究成果，其科学性、有效性仍会令人们产生某种程度的疑问，如来自政府层面的数据统计能否做到真实准确、评价指标体系的设计是否完整等等”。唐昊．红皮书是有益的社会评价体系[N]．羊城晚报（A2版）,2007-11-14. 事实上，到目前为此，学术界对如何实现政府整体绩效评价结果存在分歧，比如，在技术路径方面，共同的思路是应用层次分析法（AHP），亦有学者提出数据包络分析法（DEA），或AHP和DEA两者组合法。这些方法基于共同的假设：作为基础数据来源的专家咨询调查是可行的，但实际上，这种理论性假设与现实相距甚远；在指标体系方面，尽管不同研究者提出的体系不同，但大都基于经济、效率、效益三维逻辑框架，涵盖了社会、经济、科教、环境以及政府内部管理等维度，存在的问题显而易见：一是以现行体制为条件，将政府运作的过程与结果结合起来，本质上是目标考核。二是绝少考虑到政府成本及公众满意度，技术体系似乎为被评对象“量身订做”，偏离政府绩效的内涵结构，甚至将评价视为上级政府强化对下级政府监控的“理性工具”。

从结果导向和行为过程来看，我们以为，现实条件下，我国政府整体绩效评价是公民对政府表现的综合评价，其过程承担民意表达的功能，其结果为民主政治发展和行政体制改革的内在动力。衡量指标体系科学与否终极标准在于人民满意，即技术层面上的公众满意度。

首先，政府整体绩效评价过程承担民意表达功能。民意作为一种自下而上的意志表达，它是一个社会多数人的利益集合，是现代社会及政府运作的风向标；民意的充分表达和广泛汇集是现代政府合法性的重要基础。就本质而言，民意表达是造就一种机制，让公民得以有评判公共管理和公共服务，主张自己的利益的权利。政府整体绩效评价内置了公众满意度导向，从理念上反映了政府治理寻求社会公平和民主的价值，是公众表达利益主张和参与地方政府管理的重要途径；从过程来看可以承担起民意表达功能，原因在于：一是评价的组织者和发起者一般都是作为独立第三方的学术机构、媒体及其他非政府组织，民间性与独立性使评价具有广泛的群众基础，给公民提供了一个民主参与和评价政府的载体；二是就评价过程实施而言，政府整体绩效评价运用了类似于通常的民意测验方法，包括启动专家咨询程序、发放满意度调查量表等，这些主观测评体现了专家或者受访公众本身的意志表达，也即一定范围内的民意聚集。

其次，政府整体绩效评价结果是民意的综合反映。从终极目标来看，评价的生命力在于回归公众本位。“新公共管理运动的核心取向——公共绩效——在其开展过程中所体现出来的对效率和民主的同时关注，也决定了它不仅是一种单纯的管理工具，而是日益追求和体现着现代民主的价值理性” 卓越．公共部门绩效管理工具理性与价值理性的双导效应[J]．兰州大学学报，2006（9）:27-32. 。在这个意义上，政府绩效评价的结果就构成了综合民意、推进民主的重要助推器。评价结果所引发的民意与政府意志的互动、关联与反馈，最终实现以评价来推动善政进而建立善治（Good Governance）。

因此，从逻辑源头与方法论的角度，政府整体绩效评价本质上是主观评价，或者说是公民对政府表现的综合评价，那么，不论采用什么样的指标体系，评价结果的科学性、适应性与合理性均可通过公众对政府总体表现满意度来检验。基于这一思路，我们可以依据实证研究的结果，比照不同的指标体系下，政府整体绩效评价指数与公众对政府总体表现满意度指数的吻合程度，检验理论假设的科学性与合理性。

但与此同时，公众满意度测量存在条件，前提是公众能够并可以理性表达个人偏好。现实条件下，我国并不具备这种条件。因此，民意调查所推进的民意表达功能的实现程度有限。一方面，现阶段中国民意调查的社会环境不成熟，在西方，选举市场某种程度上等同于政府整体绩效评价，我国的社会性质决定不能采用西方式的民主投票。另一方面，中国民意调查的技术条件不成熟。包括：公众的政治参与意识不强，热情不高；信息的匮乏、不对称和公众认知的偏好较为感性化；政府政务公开程度不够；抽样调查技术本土化开发与应用不足，等等。或者说，公民社会的发展还不成熟，尚未孕育出直接评价政府整体绩效的社会土壤。这样，以主客观指标于一体的政府整体绩效评价指标体系才可有效地承载起这种民意表达过程与结果的功能，融合主、客观指标的政府整体绩效评价的指标体系不仅强化了操作上的可行性，评价结果亦更加趋近公众的真实意愿，或者说，评价结果比公众单一满意度评价更加理性。但从根本上说，这种技术结构与系统不改变隐含的预设前提：公众满意是政府施政的归宿点，不论是评价绩效的指标层，或者具体指标，均必须以民意作为导向，满足民意需求。

“广东试验”实证表明，在既定方案下，针对广东地方政府的绩效评价指数基本吻合“公众对当地政府表现总体满意度”单一指标的评价结果，从而反证了政府整体绩效概念及其理论假说（衡量指标体系科学与否终极标准在于人民满意）的科学性与可行性，这一结论亦具有普适性。或者说，从方法论上为政府整体绩效评价指标体系设计提供了技术路径。

（五）动力机制：持续与否源自民间

政府整体绩效评价是一项复杂的社会活动。涉及多重利益主体，需要投入巨大的资源，独立第三方评价活动持续与否倍受社会关注，或者说，民间评政府绩效的动力来自何方？

在我国政府绩效评价实践探索中，“甘肃模式”（委托第三方）备受赞誉。2004年，针对民营经济发展缓慢的境况，甘肃省政府委托兰州大学针对民营企业，就政府绩效进行评价，后来被媒体称之为“甘肃模式”或者“第三方评价”。作为政府绩效评价的一种新型模式，甘肃实践在核心思想、理论支撑、指标体系以及程序和方法等方面都有创新，本质上是基于满意度导向，通过评价，形成了公众（动力）—政府（压力）—政府内部（需求）绩效评价的传导机制。为民间组织、公众参与政府公共政策和公共治理提供了有效方式，对我国地方政府绩效评价的理论研究及实践探索产生了重要影响。但作为委托第三方评价活动，“甘肃模式”并没有持续开展，评价与否取决于（委托方）行政领导人的认识与推动，“领导人的态度与职位变动会使评价受很大的影响” 郑方辉，李振连．评地方政府整体绩效：社会经济转型背景下的“广东试验”[J]．当代世界与社会主义，2008（5）:131. ；换言之，评价与委托方的意图密切相关，不可预期性较大。

作为独立第三方评价，“广东试验”不受“领导人的态度与职位的影响”，但面对的问题依旧存在：一是来自被评对象的压力。针对地方政府整体绩效的评价结果反映了年度政府政绩，一定程度上被视为行政首长的“成绩单”。政府整体绩效评价排名必然有先有后，一旦排名垫底或大幅度降低必然引起社会各界的议论与追问，甚至是上级政府的问责。进而，被评对象将通过各种方式给评价主体施压来影响。二是整个评价举动依旧被拒斥在体制之外，主要资料信息源自真伪混杂的各类年鉴，即或是由评价者主导的调查亦受到许多限制，被评价的对象从未放开过第三方评价者的权限。三是评价活动需要投入巨大资源，尤其是公众满意度调查代价不菲，等等。正因为如此，独立第三方评价政府整体绩效的动力机制尤为重要。

应该说，广东基本具备由第三方评价地方政府整体绩效的条件。广东是改革开放的先行者，经济发达，民间力量在经济发展与社会发展的作用举足轻重；广东比邻港澳，乃近代民主革命的发源地，也是新思想和新观念策源地，改革开放以来，公民意识增强，以民主的方式调整各种利益关系已为常态，尤其是近些年来，广东初步建立运转良好的问政与回应机制，评价政府的社会条件基本成熟。“在政府自己评估、自己发布的途径之外，来自民间独立、系统的评估视角的建立，对建立社会主义民主政治是有力和有效的促动，而政府似也在承认这种民间评价的价值，应该说这是一种可喜的互动，表明的是政治上的进步和成熟” 唐昊．红皮书是有益的社会评价体系[N]．羊城晚报（A2版）,2007-11-14. 。

但尽管如此，独立第三方评政府整体绩效的动力源自民间。历史经验表明，社会变革的动力在于民间，社会襄助政府变革的可行性不可低估。独立第三方评价虽在信息的全面搜集方面或许有闪失，“但民间评价所需的独立性因此保全，而独立性恰恰是这一评估计划的生命力所在”。社论．评价政府绩效，民间机构应恪守独立性[N]．南方都市报（A2版）,2009-10-13. 或者说，“民间对政府的看法能否带来实际变化，其希望并不在于民间的评估体系能否进入体制内部，或代替主流评价标准，而在于坐实民间机构的本分，坚守民间的价值立场。” 社论．评价政府绩效，民间机构应恪守独立性[N]．南方都市报（A2版）,2009-10-13. 唯有保全评价的民间性，才能维护评价的独立性，因此，从发展趋势看，“广东试验”“第一要务是自觉排除被体制招纳，不屈服；其次要培育评价报告的公信力，不媚权。与大众媒体中绝非充裕的公共声音一道，以学术的公共性壮大舆论声势，加强监督政府的社会协作。犹如响应梁启超的呼吁，健全舆论的五本：常识、真诚、直道、公心和节制。” 社论．评价政府绩效，民间机构应恪守独立性[N]．南方都市报（A2版）,2009-10-13.

四、本年度技术方案

为维持技术体系的稳定性与可比性，本年度技术方案（2016，针对2015年度）基本源自上年度方案。自2007年以来，本项研究的技术方案经过三次微调，但坚持以下基本理念：一是反映和体现全球化背景下民主政治、法治社会、市场经济、有限有效的现代地方政府的职能实现的程度。贯穿执政为民的终极目的是实现公众满意。进而将地方政府职能定位于：促进经济发展、维护社会公正、保护生态环境、节约运作成本、实现公众满意。二是考虑到处于体制转型、价值重组以及向民主政治、市场经济转变过程中的中国特色，地方政府的绩效评估肩负着双重责任，首先是评估政府的成绩和效益，同时又要引导政府向现代政府转变。三是原则上针对一定时期内（一年）政府行为所带来的社会经济环境变化的增量，并非存量（个别指标除外），目标评价形成本质差别。四是体制外评价，强调政府管治与服务的结果，体现第三方立场。

（一）2007-2011年技术方案

2007技术方案确定了50个具体指标，其中40个客观类指标。2008技术方案依据既定的理念和思路，针对缺失具体指标的领域内涵层，增加了主观与客观指标，相对于上一年，具体指标覆盖的领域内涵层增加了4个，更能有效地体现地方政府整体绩效的方方面面，即衔接了上一年方案，又改进了原有的不足。但基于主客观原因，2008方案仍存在一些问题，主要表现为：一是38个领域内涵层仍存在缺失具体指标的情况，尤其是一些总量性质的指标。二是指标衡量需进一步统一和规范，指标评分标准亦如此。三是指标体系的稳定性问题。一般来说，绩效指标应该在一段时期内保持相对稳定。2008技术方案在原有基础上增加了6个指标，替换了3个指标，使指标数量从原有的50个增加到56个。

针对2008技术方案中存在的问题，2009年度技术方案对评价指标体系进行重新修订，替代了7个指标，增加1个指标，合计采用57个指标。力图克服部分指标鉴别度低、相关性强、价值导向不明显等缺陷，进一步覆盖领域内涵层，同时，替代指标不改变体系结构，维持评价体系的相对稳定。同时，对不同评价周期的结果进行比较，检验评价周期对评价结果的影响程度，探讨政府绩效评价的合理周期，尤其在满意度调查中增加了公众“对过去一年当地政府总体表现满意度”的调查内容，并力图开发为关键性绩效指标。

对2007—2008年依次递增的四套不同指标组合方案的检验结果表明，当指标达到一定数目后，再增加指标数目对结果影响变小，考虑到指标增加所取得数据值的成本，由50-60个指标组成的方案不失为一套行之有效的可执行方案，改善路径不是立足增加指标的数目，还是使指标尽可能覆盖全部38个领域内涵层。郑方辉．《2008广东省地方政府整体绩效评价红皮书》[M]．北京：中国经济出版社，2009:210-123. 为保持连续性与稳定性，2010、2011年度技术方案维持不变。

（二）2012年技术方案

2011方案为比较成熟的方案，其特点有二：一是部分指标有较强的关联性，二是38个领域内涵层过多，为此，我们在领域层导向下，进一步优化与归纳领域内涵层（至16项），同时在主观评价领域，增加“幸福感”一项。同时，针对三级指标关联性，减少了常住人口规模、交通运输投资支出、人均邮电业务量、酸雨频率、机动车拥有量、公车拥有量等6项指标。同时，方案进一步考虑地级以上市政府与县级政府评价指标的差异。如城镇恩格尔系数不适合于山区或农村县级政府评价；实际利用外资增长率对于某些山区或农村县级政府来说显得苛刻，平均造林面积对于山区县来说没有实际意义，等等，均以关联性指标替换。还有一些指标，如年日照时数、空气污染指数API大于100天数对同一个市下辖的各个区（县）域来说并没有太大的区别，视为“均等”，有些指标改变源自统计源变化，如“单位GDP电耗增长速度”替代“单位GDP电耗”、“城镇污水处理率”替代“工业废水排放达标率”及“城镇生活垃圾无害化处理率”替代“工业固体废物利用率”。

在权重系数方面。由于部分指标变化导致权重系数相应变化，但对2008年评价指数的大范围检验结果表明：“总的来说，领域层权重的调整幅度如在10%以内，指数结果具有稳定性，对结构的影响不明显。扩大调整幅度，则变化相应增大。相对而言，各领域层的影响强度依次是，实现公众满意→保护生态环境→促进经济发展→维护社会公正→节约政府成本，即，公众满意领域层的权重变化对评结果影响较为敏感；对具体指标而言，权重系数在给定范围内（执行方案基础上正负20%）变化对绩效指数及结构的影响并不明显。” 郑方辉等．政府整体绩效评价：指标权重设计及实证检验—以2007广东省为例[J]．甘肃行政学院学报，2009（3）:53-59.

这样，2012方案中，指标权重的处理方法是：首先，维持五个领域层权重系数不变，即促进经济发展占28%，维护社会公正占25%，保护生态环境占15%，节约政府成本占12%，实现公众满意占20%。其次，在促进经济发展领域层中，替代的“教育经费占GDP比重”指标与被替代的“常住人口规模”指标权重一致；在维护社会公正领域层中，被替代的三个指标所占权重总和按25%-30%的比例分摊到保留的11项指标中；在保护生态环境领域层中，被替代的两个指标所占权重总和按一定比例分摊到保留的8项指标中。在节约政府成本领域层中，被替代的“公车拥有量”指标权重按一定比例分摊到保留的5项指标中。最后，在主观评价领域层，公众“对当地政府总体表现满意度”权重保持不变，为3.1%，增加“幸福感”一项，权重为2.6%，其他13项指标权重调整为1.1%。

另一方面，满意度指标开发是本项研究的一大特色。“公众满意度这一维度具体指标的设计则充分体现了‘整体绩效评价’性，它通过13个具体指标（2008方案）将公众所关注热点内容一一呈现出来，督促地方政府及时调整战略发展目标和政策，全力塑造责任回应性政府。” 郑方辉等．2008广东省地方政府整体绩效评价红皮书[M]//卓越．研究体现工具理性与价值理性相融合的双导效应．北京：中国经济出版社，2009:6. 本年度沿袭这一方案，并增加了公众“幸福感”指标。同时，为比较不同调查方式所取得信息的真实程度。2011年，我们选择了江门、佛山两市，利用两种完全独立的调查方式（采用同样问卷）完成调查。比较结果表明，总体上看，前几年一直沿用的分层多级、定点拦截、现场配额的调查方法具有较好的稳定性、合理性与可操作性，尤其到地级以上市域的调查结果，由于样本量较大，调查误差得到有效控制。

（三）本年度技术方案

总体上，十年来，指标体系有所变化，但评价理念和指标结构未变。既考虑到各种环境因素变化（如数据统计源变化）对指标调整的需求，又尽可能保持技术体系的稳定性和持续性，尤其是坚持评价维度（5项一级指标）的稳定性，2012年度对二级指标（领域内涵层）的重新优化组合，更加清晰地界定了政府职能的实现方式，为具体指标设计提供了更有说服力的依据。2013年延续了2012年评价技术方案，为维持方案的稳定性、持续性，最近两年继续采用2012年的技术方案。但由于统计数据源变化，“政府消费占最终消费比重”指标因数据缺失剔除，2014年评价指标体系由51个指标构成，为了维持二级指标“政府消费”权重不变，“一般公共服务支出占财政支出比重”指标权重相应增加。2015年参照上一年度评价方案，考虑到电子图书的广泛使用，加上数据不完整，决定剔除了“公共图书馆人均藏书量”指标，同时将“千人拥有病床数”和“城乡居民收入差异”权重做出相应调整。2015年评价指标体系最终由50个指标构成，2016年采用与2015年相同的指标体系。

表1-1 2016广东省地方政府整体绩效评价指标体系（指标与权重）

表1-2 2007-2016技术方案（指标体系）比较

上篇 广东试验

第一章 研究概述