专题:在合适的颗粒度上做预测

我们在前面多次提到,提高预测的准确度,一大关键是在颗粒度大的地方做预测。其后的逻辑是颗粒度越大,需求的聚合效应越明显,从数理统计的角度而言,可预见性就越强,数据模型就越可靠,预测的效果也就越好。这里我们作为一个专题,来进一步探讨。

让我们先看个具体的例子。

有个电商,在亚马逊、eBay、淘宝等多个平台上有门店,而且在同一个平台上可能不止一个。比如他们在亚马逊上就有5个门店,分布在不同的地域(见图1-22)。长期以来,对于国际业务,该电商是店铺销售经理们做预测:每个月,每个店铺经理要预测未来三个月的需求,逐个产品逐月预测,发送给销售总监审批,然后转给总部,总部汇总后驱动供应商准备产能、库存和安排生产计划。

图1-22 案例电商的总部与店铺结构

你知道,多个店铺经理做预测,颗粒度太小,预测准确度很难做高,还不用说店铺经理的特长是销售,不是计划。我的建议是让他们在总部层面做预测,设立专门的职能负责需求预测。当然,我不能简单地说,我写过一本书,书上说在这种情况下,集中预测的话准确度高,我得证明给他们看啊。

于是我就分析他们的需求历史,掐头去尾,除掉新产品和即将下市的老产品,挑选了558个有代表性的量产阶段的产品做分析。这些产品中,平均每个大概在3个店铺中销售,共有1885个“产品—门店”组合。当店铺经理们在每个门店层面做预测时,需求的离散度[1]相对更大,预测难度就更高。比如我们分析历史需求,需求离散度的平均值接近1.4。如果在公司总部集中做预测,这时候预测对象就由1885个变成558个,经过整合,需求的变动性也降低,表现在平均离散度只有1,如图1-23所示。离散度越小,表明需求相对越稳定,也更容易预测。这就是说,集中预测时,预测的技术难度更低,客观上可能做出更准确的预测。

这也可以从“短尾”[2]产品的比例得到更直观的解释。当在各平台分散预测时,只有60%不到的产品是“短尾”,别的都是更难预测的“中尾”或者根本没法预测的“长尾”;当把各个门店的需求集中起来,在公司层面预测时,“短尾”的比例就提升到接近80%,如图1-23所示。“短尾”产品越多,理论上越好预测,预测的准确度也越高。

图1-23 集中预测降低了预测的难度

需要说明的是,对于案例电商,各门店不做的预测,指的是驱动供应链的预测。该预测覆盖的时间一般较长,在案例企业是3个月,因为要至少覆盖整个采购提前期,以指导供应链的生产与采购。对于日常的补货计划,一般覆盖两三周,各店铺还是要做。不过好处是,补货计划影响的是店铺到总库这一段,交期较短,即便预测失败,补救的话也相对容易。

对于驱动供应链的预测,我们尽量要在颗粒度更大的总部做,以提高预测的准确度,就如下面要讲的“自来水模式”。

[1] 离散度是标准差除以平均值。离散度越大,表明数据的变动性越大,预测的准确度也越低。

[2] “短尾”在这个案例中定义为在过去13周,有8周或以上有需求,表明需求相对频繁。当然,这只是本案例的切分方法,并不是什么标准,请读者明鉴。整体而言,“短尾”产品的需求相对频繁,也相对稳定;“中尾”产品的需求相对频繁,但不稳定;“长尾”产品的需求既不频繁,也不稳定。对于不同产品的预测,我们在后文还会详细讲到。