导读

世界各地的科学家们正在努力解决各种各样令人费解的难题。有些科学家试图将《星际迷航》中的“曲速引擎”这一概念从幻想变成现实;有些科学家则试图解开意识之谜;还有些科学家想要知道,在原子之下,是否还有几乎看不见的、另一种层级的振动弦。这些研究人员大多在黑暗中摸索着前进——发展新的假设,创造新的工具,进行新的研究,以微小的进展推动人类知识的进步。很多时候,他们的探索会走错方向,在他们走进蜿蜒曲折的死胡同之后,又不得不立刻折返。一旦有了突破性的发现,随之而来的便是更大的挑战:说服那些不相信的人,并找到实际的应用,再大规模地推广创新。

相比之下,我们所做的要容易得多。我们在教育方面的“实验”已经进行了很长时间。在18世纪60年代的普鲁士便已有“试点研究”,从那时开始,一种全球教育模式便历经考验和更新迭代,并在全球推广。关于最有效的方法的数据也以指数速度增长。据我们统计,目前有超过150万篇(部)关于如何教学、如何学习、如何管理学校,以及如何提高学生成绩的研究文章和著作。

与其他科学家们改进(理论上的)曲速引擎和粒子物理模型相比,可以说我们的教育事业建立在更为坚实的基础之上。在几十年的认知心理学实验室研究中,我们对记忆、注意力、遗忘、动机、迁移、习惯形成和儿童发展阶段有了较深的了解。我们还有一座像珠穆朗玛峰一样的研究高山需要攀登——评价基于这些认知心理学原则的学校项目。这些项目本身就是一个可供我们结合自己的教学环境进行选择、执行的丰富的工具集。

事实上,至20世纪70年代初,经过200多年的反复试验,我们关于何为最有效的教学方法已经有了很好的了解,这些方法已被编入教师培训和资格认定标准、课程和学校管理系统。自1970年各国开始国际学生能力评估计划(即国际学生评估项目(PISA)、国际数学和科学研究趋势(TIMSS)、国际阅读素养研究进展(PIRLS)的前身),我们期待,统合调配所有经过试验和测试的工具,学生在这些国际评估中的成绩将会不断提高。

实事求是地看,当达到最低门槛(即仅达到及格水平)的学生占比提高时,国家的教育水平会有明显的改善。在以英语为主的国家,现在平均有93%的学习者达到了这个水平。然而,这种差距的缩小大多发生在2000年之前,在过去20年左右的时间里并没有明显的进步。如图表0.1所示。

然而,在高标准(即学生在考试中获得“A”等级)的学生比例方面,情况就那么不乐观了。如图表0.2所示,在过去的45年里,澳大利亚和加拿大学生达到高标准的比例仅小幅上升了几个百分点,新西兰则(稍)有下降。美国和英国做得更好,尽管呈蛇梯式增长,但仍有近30%的学生达到高标准。但这仍没有达到新加坡、韩国或日本水平的一半。注意,在阅读这个数据集和我们的分析时,在“警告”框中已经强调了注意事项。

从这张图表中我们仍可以看到,新加坡、日本和韩国学生达到高标准的比例处在较高水平。这告诉我们,从理论上讲,美国、英国、加拿大、澳大利亚和新西兰的大多数儿童,实际上是世界各地的儿童,也都有可能达到最高水平。

关于高影响力策略的研究也不少,这些策略能使儿童达到上述最高水平。可视化的学习数据库展示了大量的方法,如果实施得当,可以显著提高学生的成绩。其中一些方法的效应值(effect size)达到1.0,还有一些持续达到或超过d=0.601的效应值。说明这些策略是很有效果的。更为重要的是,大多数研究都是在以英语为主的国家(主要是美国、英国、加拿大和澳大利亚)开展的,研究也都是用英语写的。因此,我们更容易看到这些研究成果与以英语为主的国家的教育水平直接相关。

因此,在我们看来,在全球研究中孕育出的经验智慧,与之后将这些如珍珠一般的宝贵经验转化为学校和课堂的大规模实际行动之间,似乎存在着巨大的差距。难道是我们的执行存在问题吗?

关于执行的问题,我们并不仅仅指贯彻一个基于证据的项目,并将其坚持到底的挑战,当然,这必然是其中重要的一部分。此外,还有一整套前期和后续的步骤,包括发现或识别出合适的,准备应对的教育难题,设计或适应对恰当的已知问题的干预措施,将设计付诸实践。再通过先前的行动链,第一,监测你是否做了计划要做的事情。第二,评价实践是否产生了足够的影响。第三,反复加强、维持,将可能成功的经验与成果扩展到其他学校。执行的每道程序比执行这个行为本身重要得多。


我们并不孤单

我们应当鼓起勇气,全球范围的实证与地方实际影响难题之间存在的矛盾,并非只存在于教育领域。我们在医疗行业的同仁们也面临着同样的挑战。据统计,广泛采用新的医学理论平均需要17年,在这一过程中亦有相当大的损耗。在实践应用后,卫生保健行业经常跳过那些已被接受的条例,为了更好地适应个人诊所或医院的本土化需求,关键的步骤完全被忽略了。

以静脉注射为例,静脉注射是用药和输液常见的医疗程序。医学科学已经告诉我们插入、监测和管理是最好的程序。但每年仍有超过25万人通过血液感染,就是因为静脉注射这一步骤没有按要求操作,有些步骤被忽略了。这种“适应”使疗效大打折扣,细菌乘机潜入。因而,本土化(字面上)也可以是一个杀手。

医疗设计人员面临的一些常见的执行阻碍包括下面列出的关键9条。你可能想跳过这些,重新开始教育的话题,但现在,这关键9条值得你投入精力思考片刻。稍后你就会知道原因。

医疗科研人员日益关注执行问题上的差距,为此他们建立了一个全新的子领域,称为应用科学。其目的就是在医院和诊所有效推广高效的方法,这些医院和诊所往往在不同且分散的管理体制下运作,在不同的当地社区人口统计和卫生保健方面有不同的需求,在组织资源、技能水平、兴趣、意愿,以及应用能力等方面存在差异。现在,大多数可用的最佳研究和工具都来自应用科学。

然而,以上所述与教育有何关系?

答案简单明了:关系密切。

在继续阅读之前,我们一起回顾上述9个关键阻碍,但这次希望你在头脑中换掉一些词。

如果这个表格对你来说太长,记起来太困难,还有个更简单的规则:把任何与医疗有关的词都换成相近的、教育相关的词语。

这样你感觉怎么样?

你会发现并且认同,在应用方面,教育行业正面临着与医疗行业完全相同的挑战。因此,我们需要建立教育领域的应用科学。这就是我们构建5D可见的教学影响力模型的原因。


何为5D

5D是构建可见的教学影响力的应用模型,供学校和教育系统使用,先发现(Discover)值得追求的目标及值得解决的问题,然后设计(Design)工具和能够完成目标的流程。设计工作完成后,下一步要执行(Deliver),要将设计带入生活。接下来进行复盘(Double-Back),也就是回溯你的步骤,监测进展并评价影响。最后,再升级(Double-Up),在复盘中学习重复,维持和扩展。你可能已经注意到,所有加粗显示的单词都以字母“D”开头,一共有5个:因此是5D。

那何为“构建可见的影响力”呢?“构建”意味着精心的设计。例如,一般情况下,房屋建筑商不会带着挖掘机到工地上,边挖边补。而是先提出一个符合土地轮廓、精心设计的规划,符合分区规定,确保完工的结构既适应环境也满足用途。

当然,如果你看过像《喜欢它》《让它上市》或《伟大的设计》这样的电视节目,你就会注意到,在建设开始时,常会发生意料之外的事件,需要建筑师和建造者进行调整和更新,重新设计。有时行业内标准的做法并不适合某个特定的环境,而一些重要的东西却被意外地忽略了,有时是赞助商改变了主意:临时想要一个地下游泳池。因此,“构建”这个词意味着,在开始执行之前,得有一个深思熟虑的设计,以回应发现的需求。但是,在执行设计时,还需要系统地对变化的环境做出回应。

“影响力”,对企业来说就是一个明确的目标。这个目标比要完成的计划和任务清单上所有的项目都要广泛得多。相反,当你正在着手一项任务、一场改革、一份引人注目的事业、一项崇高的使命时,你头脑里唯一的想法就是目标,没有实现目标便不罢休。你正在进行的设计是实现目标的手段。如果你的设计没有完成这个目标,你便会毫不犹豫地将整座大厦拆掉,再重新开始。你总是被目标所激励,不拘泥于方式方法。

“可见的”表示这是一项正在进行的工作。这是一个正在进行的建设项目,从某种意义上说,可能需要一直进行下去。当然,一旦你有了主要的防水结构和功能,努力的强度便会降低,但总有持续进行的维护维修工作,借此,你努力的成绩能一直保持下去,不会让你辛勤耕耘的辉煌化为乌有。

如何构建可见的教学影响力?

为了构建可见的教学影响力,我们进行了如下步骤:

1. 分析了50种不同的执行方法和流程,涉及教育、企业管理、战略咨询、医疗保健、制造、建筑、国际开发、软件工程和人力资源。最终我们确定了100多个子过程和工具。整体概述参见附录1、附录2。

2. 在50种方法中确定了5个阶段的执行过程。参见附录3。

3. 借鉴现有的统合分析和应用的系统评价,将流程、子流程和工具减少到更易于管理的水平。参见附录4。

4. 结合我们在50多个国家和地区的教育系统、学区和学校实践应用计划的经验,我们的大团队为10万多名教育工作者提供了支持。为解决棘手的执行问题,我们也引用了已出版的出版物。

我们将这些过程和工具融入在5D框架中。如前文所述,这5个阶段的首字母都是“D”,简称5D:

D1:发现(Discover)—— 明确值得追求的教育挑战或目标。

D2:设计(Design)—— 对设计空间中的不同选项进行系统的检查,选择、设计高概率的干预措施,在执行前进行压力测试,并制订监控与评价计划。同时,确定最优停止的时间,为构建影响力留出空间。

D3:执行(Deliver)—— 将确定的设计付诸实践,收集用于监控与评价的数据。

D4:复盘(Double-Back)—— 监测评价实践过程,决定下一步的去向。此步骤可能会让你回到D1和D2或前进到D5,也可能让你在此停下脚步。

D5:升级(Double-Up)—— 从可持续度和可扩展度两方面进行考量,维护并增强教学影响力。

在阅读图表0.3和图表0.4时,你会注意到复盘明确地融入所有其他阶段。这是因为,首先在D1、D2和D3阶段中要为评价工作打下基础,以确保在D4阶段能正确地进行评价。如果错过了这些步骤,评价工作就不能正确地开展,就不能系统地执行5D模型,更主要的是,你的主动性很可能会消失(很可怕)!但是复盘并不仅仅是在执行开始后才开始进行,每个阶段都需要进行内在复盘,这样你就可以在确认目标、设计的合理性之前,就预先对(假设)流程中所有关键环节进行评价检测或压力测试。

当你在5D流程中循环往复时,你会面临关键的挑战之一,就是数学家所说的最优停止时间。换句话说,就是指在你开始做某件事之前,你要花多长时间来搜索、收集数据及审查选项。数学家们认为,用于搜索和探索的最佳时间比例是37%,这样就留下63%的时间用于执行、评价及其他方面的工作。如果要大规模、高成本、跨多个学校来执行一项计划,那么这样的时间比例对我们来说似乎是正确的。但是,如果要在一个学校或专业学习社区工作,那么速度可以加快些。否则,你会发现,一个学期或学年过去了,你还处在搜索和探索阶段,没有开展任何工作。

重申一下,复盘,即评价性检查,明确地嵌入了整个5D模型。这样做方便应对执行工作中各步骤缺乏定期评价与检测的情况。我们绝不会带着挖掘机和水泥搅拌机出现,然后边做边混合。我们在一切流程开始之前就做好设计,然后根据实践的反馈进行调整以扩大我们的影响力。

在图表0.5中,我们会提供一张流程图,展示出执行5D模型时的步骤和活动。从图表底部开始,一直往上再回到底部。流程图还清晰地展示了复盘评价性检查的活动。

然而,将复盘的清晰含义融入其他阶段,表面上看起来是按照高度线性的执行模型进行,实际上并非如此。在现实世界中,实际情况可能类似于图表0.6。

思考,测试,试验,再重复。循环往复。你可以把这些评价性过程想象成不断地在发散思维(即创造性思维)与趋同思维(即批判性思维)之间来回切换,最终在目标问题上达成一致。该过程我们会在图表0.7中展示。

这太难了

当我们分享这些步骤时,我们常见到的一种反应是:“遵循这个过程太难了。我们需要更简单的过程。”我们需要说明的是,整个过程执行起来确实很困难。这就是如此多的学校和教育系统进行改进却最终失败的原因。的确,你可以改变你在执行这些过程时所花的时间:或缓慢思考,深入挖掘,并在执行前仔细分析每个微观参数;或快速思考,在头脑风暴时花几个小时研究每一个步骤,然后进入迅速执行和复盘阶段。这就再次涉及最优停止的问题。据此,我们给出的指导意见是,花费多长的时间取决于你想要完成的事情的规模。目标越大、人数越多,过程中可逆转的难度就越大,你就越有可能从缓慢的思考中获益。

如果教育工作者都认真思考书中概述的因果推理、实证交叉检查和评价性问题,会有很大收获。我们认为在学校和学区的层面上可能缺少一个角色——执行顾问甚至是应用科学家,他们知道工具,知道在哪里可以找到外部数据来源,还要知道如何系统地评价影响力。学校领导者是不固定的,而执行顾问能够使流程持续地执行。而且在理想的状态下,执行顾问是可互换的,因为他们使用通用的工具语言和程序。

我们知道执行顾问的工作是重要的,一系列研究已经明确了执行的意义。图表0.8中已经列出关键数据,详细表格请参见附录4。

当然,没有执行顾问不意味着你有借口不作为。你需要自己采取行动,借助这些工具持续地思考、行动,系统并科学地执行每一个阶段的步骤。

最后,简要介绍一下这本书的结构。下面的每一章都是对构建可见的教学影响力不同阶段的介绍。每个章节都以介绍背景信息开始,再按照图表0.4中的步骤进行阐释。执行是一个极其复杂的话题,但是我们尽量保持简明的语言风格,并在本书中为大家提供了一些实用的工具,你可以直接在阅读文章时应用这些工具。结论部分总结了关键信息。我们(还为高手)准备了4篇附录,分类呈现我们在全球应用研究中的关键成果及资源。我们希望你能借助它们来构建你自己的可见的教学影响力。

看完导读,是时候开启发现(D1)的旅程了!


1 效应值(effect size):在比较平均数的情况下,效应值常指实验结束后,实验组与控制组之间“标准化后的平均差异程度”,效应值的绝对值越大表示效应越强,意味着现象越明显。依照惯例,效应值d=0.2等级为较小,效应值d=0.5等级为中等,效应值d=0.8等级为较大。——编者注