如何防范一分为二的错误本能

当出现以下三种情况时,你要提高警觉,有人可能会告诉你(或者你自己认为)存在一个巨大的差距,并触发你一分为二的本能。这三种情况分别是:只比较平均数、只比较极端情况和只俯视不仰视。

只比较平均数

希望大家不要误解我的意思,我喜欢平均数,平均数是一个很简便的统计信息的方法,而且平均数会告诉我们一些有用的信息,现代社会离不开平均数。我这本书也离不开平均数。书中有很多地方都利用了各种平均数。但是对信息的过度简化,通常也有可能带来误导性的信息。平均数最大的问题就是它用一个单独的数字取代了大量数据的分布规律。

而当我们对两组平均数做比较的时候,我们就有可能犯一个更大的错误。我们可能只看到了两组平均数之间的鸿沟,而错过了两组数据之间重合的部分。所谓的鸿沟在事实上并不存在。

平均数学成绩

来源:College Board via Perry

平均收入(美元/天)

来源:Gapminder[10] based on PovcalNet & IMF[1]

举个例子,我们看一下上面的两张图。

左边的图展示了自从1965年以来,所有年份男性和女性的数学考试的平均成绩。右面的图展示了美国和墨西哥人民每年的平均收入水平。你可以清晰地看到两张图表展示的两组平均数之间的鸿沟。男性相对于女性,美国相对于墨西哥,这两张图似乎能够清晰地表示男性的数学成绩普遍要好于女性,而美国人的收入是高于墨西哥人的。从某种意义上来说,这个结论是有道理的。但是正确到什么程度呢?是所有男性的数学成绩都比女性要好吗?是所有的美国人都比墨西哥人更富有吗?

平均数学成绩

来源:College Board via Perry

平均收入(美元/天)

来源:Gapminder[10] based on PovcalNet & IMF[1]

那么让我们来看一下数据背后的真相吧!首先让我们调整一下纵轴坐标的比例。这样看起来,原来似乎很明显的鸿沟变得非常小了。然后我们再来看看同样的数据,它的分布是什么样的?我们来看一下特定一年的数学成绩的分布和收入水平的分布。用这样的方法我们就可以理解,平均数背后代表的数据的分布究竟是什么样子。

2016年不同数学成绩的人数分布

来源:College Board

2016年不同收入的人数分布

来源:Gapminder[8] based on ENIGH, US-CPS & PovcalNet

看到了吧,男性和女性的数学成绩的分布几乎是完全重合的。大多数的女性和男性的数学成绩是差不多的。我们再看看美国和墨西哥的个人收入分布情况。我们可以看到美国和墨西哥的个人收入水平是有部分重叠的。所以,当我们用这种方式来分析数据的时候,我们就会发现这两组人:男性和女性,墨西哥人和美国人,并不是完全一分为二的。它们的分布是有重叠的,而中间是不存在鸿沟的。

当然一分为二的表达方式也可以反映一些现实。在实行种族隔离制度的南非,黑人和白人生活在完全不同的收入水平之下,而且你确实可以发现他们之间收入的鸿沟。在这种情况下,一分为二的理论是完全合理的。

但种族隔离制度是非常罕见的。在更多的时候,一分为二的思维方式只能带给我们误导性的和过度情绪化的结论。在更多的情况下,两个组之间基本上没有清晰的划分界限,虽然有时候比较平均数的话,两者之间似乎有一道鸿沟。而当我们分析平均数背后的真实数据分布的时候,我们总能够得到一个更清晰、更准确的画面。那时我们就会发现,大多数我们看起来非常不同的族群,实际上是重叠在一起的。

只比较极端情况

我们本能地愿意采用极端的案例,因为它们很容易记住。比如说,如果我们要讨论全球的不平等问题,我们最容易想到的是在新闻中读到的南苏丹的饥荒,而另一方面,我们也很容易想到一些穷奢极侈的富人。当思考不同的政府系统的时候,我们很容易想起的一个极端是腐败、专制的政府,而另一个极端则是像瑞典这样有着充分的民主和福利系统,并且能够确保公民基本权利的国家。

这些极端对立的案例,很容易使我们产生兴趣,并且很容易诱发我们一分为二的本能。然而这样极端对立的案例,却不能帮助我们理解世界。世界上永远都会有最穷的人和最富的人,世界上也永远都会有最差的国家和最好的国家。但是极端案例的存在,并不能给我们太多信息,而绝大多数案例通常都是处在中间状态,它们的情况是和极端案例完全不同的。

以巴西为例,这个国家几乎是世界上最不平等的国家,最富有的10%的人口得到了41%的全国总收入。这一点非常差劲,对不对?听起来富人得到了太多的收入。我们马上就会认为精英阶层从整个社会盗取了太多的资源。媒体也会支持这种观点,他们会提供各种超级富豪的照片,他们的游艇,他们的豪宅,还有他们自己养的马。尽管这些富豪占全国人口的比例不到1‰。

我同意40%是一个比较高的数字,然而相对于巴西的历史来说,40%已经是几十年来最低的数字了。

巴西最富有的10%的人口的总收入份额

来源:World Bank[16]

统计数据经常为政治目的而服务,从而以一些比较夸张的形式体现出来。但是统计数据必须帮助我们认识现实,这样它们才有意义。现在让我们看一看巴西的人口,根据四个不同的收入级别,真正的收入分布情况。

2016年巴西不同收入等级的人数分布

来源:Gapminder[8] based on PovcalNet & CETAD Ministério da Fazenda(Brazil)

当我们研究收入分布曲线的时候,我们就会发现,绝大多数巴西的人口已经脱离了极度贫困状态,他们的收入水平最密集处分布在第三级。在那里,人们已经买得起摩托车,戴得起眼镜,用得起洗衣机,而且可以在银行有一些积蓄了。事实上,即便在全世界最不平等的国家,人们的收入之间也并不存在一条鸿沟,绝大多数人都生活在中间阶层。

只俯视,不仰视

正如前面我谈到过的,如果你正在读这本书的话,你最大的可能是已经生活在第四级了。即便你生活在一个中等收入国家,类似墨西哥这样的国家,但是你自己一定已经达到了第四级以上的生活水平。而你的生活水平和其他国家生活在第四级的人的生活水平是很相似的,无论那些人是生活在旧金山、斯德哥尔摩、里约热内卢、开普敦还是北京。

在你的国家,所谓的贫穷已经不是真正的极度贫困了,它只是一种相对的贫穷。例如在美国,那些被划在贫困线以下的人,实际上生活在第三级。

所以那些生活在第一、第二、第三级的人经历的痛苦、挣扎和奋斗,对你来说都很可能是非常陌生的。而他们的生活,在你能够接触到的媒体中也是很难看到的。当然,有些生活在第四级的人仍然有家庭成员是生活在第二级或者第三级的,比如说在开罗的郊区,或者印度的卡莱拉地区。

所以对你而言,要想建立一种实事求是的世界观,最大的挑战就是认识到你自己绝大多数的第一手经验是来自第四级以上的生活,而几乎所有的二手经验则经过了大众媒体过滤,大众媒体基本上只会关心那些极端的案例,却并不真正反映现实。

当你生活在第四级的时候,所有生活在第三级、第二级和第一级的人看起来是一样贫穷。贫穷这个词失去了它具体的意义。甚至有些时候,某些生活在第四级的人,看起来也很穷。也许他家里墙上的油漆开始剥落,也许他们开的是二手车。任何一个从高层建筑从上向下俯视的人都很难辨别出接近地面的矮层建筑的真实高度,因为它们看起来都一样矮。基于同样的道理,生活在第四级以上的人,总会把世界分割成两个类别:富有的,也就是像你一样在高层建筑顶上的人;贫穷的,也就是接近地面的人,他们的生活和你的不一样。很自然地,你容易向下俯视,然后说“哦,他们都是穷人”。同样很自然地,你会忽略掉这些人之间生活质量的区别。他们中有些人有汽车,有些人有摩托车,而另外一些人只有自行车;他们中有些人可以穿得起拖鞋,而有些人根本就没有鞋可穿。

因为我曾经走访过生活在不同收入级别的人,我可以负责任地告诉你,那些对你而言都生活在社会底层的,收入级别在第一级、第二级和第三级的人,他们之间生活水平的差距是巨大的。生活在极度贫困状态、收入水平在第一级的人很清楚地知道,他们每天的收入如果从1美元增长到4美元,他们可以过上比原来好多少的生活,更不用说每天可以挣16美元了。只有那些穿不起鞋,只能赤足走遍所有地方的人才会知道,一辆自行车对他们而言能够节省多少时间和体力,对他们获得更好的健康和更高的收入具有多么大的意义。

这种按照收入水平划分四个级别的框架,是用来替代过分情绪化、一分为二的世界观的。它也是建立实事求是的世界观最重要的组成部分。现在你已经明白了这种方法并不是很复杂,对不对?在本书的其余部分,我将继续使用这种四个级别的收入划分方法,去解释几乎所有的社会现象。从电梯的功能,到溺水死亡的人数,到性别划分,到烹饪方法,以及黑犀牛的数量。这种方法将会帮助你更清晰地认识这个世界,做出更正确的判断。

你怎样才能捕捉到自己所有的错误观念呢?数据。你必须依赖数据,并且描述出数据背后所体现出来的现实世界。我衷心感谢联合国教科文组织的数据统计,也真心感谢气泡图以及互联网。但仅有数据是不够的,只有当你拥有简单并且正确的思维方式时,错误的观念才会被替代,而后消失。这就是为什么我们引入以收入水平为依据进行四级划分的方法。