分位数

同样,参考工资的统计方式,另外一个常常和均值一起出现的统计指标是中位数。使用中位数可以很好地解决均值面临的极值问题和可解释性问题。

正如上面所说,均值并没有现实中直接对应的意义,而中位数则不同,假设一群人收入的中位数是1万元,那么可以说这群人中不少于一半的人的收入在1万元或以上。

由中位数引申,可以说有不少于x%的用户首屏渲染耗时在2s以内,这里的2s就是渲染耗时的x分位数,而中位数是一种特定分位数,即50分位数,是一种常用的分位数指标。这样就可以解决均值面临的极值问题,因为一般来说极端慢的用户端占比并不会太高(如果占比太高,就需要考虑是否存在一个现实的性能问题,而非需要排除的极值问题)。同样,用上面的数据来看,性能指标的中位数不会大幅度偏离大部分用户端的性能数据,如图2-7所示。

图2-7 中位数相对均值受极值的影响较小

通常将这些值称为Top Percent(TP),如TP 90代表90分位数。

2.5节在介绍Core Web Vitals时就推荐使用75分位数来确保大多数用户的体验,对性能有高追求的场景也可以采用90分位数等,如对后端接口API耗时的性能统计等往往使用95分位数这样比较高要求的统计指标。对于同样的性能指标,更高的分位数意味着有更多的用户享受到了高水平的性能体验。另外,高分位数的统计往往能够更快、更明显地暴露问题,因为高分位数关注的是性能相对较差的用户端,相对于那些性能很好的用户端,其机器的配置比较差、网络延迟比较高,对于性能问题的感知更加明显。