1.4 正式工具之统计工具

统计工具还可以再细分出4种方法。它们分别是:延伸历史数据、收缩估计、时间序列估计和多因素模型。接下来我们就对它们分别展开学习。

1.4.1 延伸历史数据

描述性统计可以总结归纳数据的特征,推断性统计能将数据用于预测。如果过去的数据是平稳的(stationary),我们便可以用历史的数据预测未来。这些历史数据包括均值(mean return)、标准差(standard deviation)以及未来数据集之间的相关性(correlations)。

在计算收益率均值时,最常用的两个方法就是算数平均(arithmetic mean)法和几何平均(geometric mean)法,这两个方法究竟哪一个更适合预测未来收益呢?依据CFA一级中数量学科的相关知识,我们知道,如果想计算投资品过去多期的平均收益,选择几何平均法是最合适的;如果我们想要依据投资品过去多期的收益表现预测出该投资品未来一期的投资表现,使用算数平均法求得的结果才是最为精确的。此外,几何平均法下求得的数值一定是小于等于算数平均法下求得的数值,并且这两类方法下计算所得的差异会随着收益方差的增加而增加。

历史样本的收益率数据可以用于预测未来的收益率,同时历史样本的方差数据也可以用于对未来方差的预测。此外,分析师不仅需要估计单个资产的方差,还需要估计组合资产的方差;在估计未来组合资产方差时,他们还需要通过样本中资产的相关性预估出未来资产的相关性。简言之,延伸历史数据(projecting historical data)就是通过历史样本数据预测未来。

1.4.2 收缩估计

当分析师认为历史样本数据不足以反映当下变化时,他就可以使用收缩估计(shrinkage estimators)的方法对历史数据的预测进行修正。收缩估计的具体做法是赋予历史数据一定的权重,再赋予其他估计值一些权重,再对二者求得一个加权平均的结果。

收缩估计法下求得的估计值降低了历史极端值对预测的影响。收缩估计法经常用于对均值以及协方差(Cov)的调整过程。当数据样本容量很小的时候,以及历史数据不太靠谱时,收缩估计法就会被频繁使用。

何老师说

假设历史数据预测出的协方差的数值为0.022,但是分析师相信该数据包含了历史上出现的极端值,并且这些极端值在未来发生的概率非常小,同时分析师自己预估的协方差数值为0.018。分析师之所以会更加相信自己的预测值,是因为它是基于一个更长时期的历史平均估计所得的结果,这种预测方法也间接地体现了均值复归的思想。那么此时在收缩估计法下,分析师可以赋予历史的估计值以0.4的权重,同时赋予自己的估计值以0.6的权重,这样得到最终的协方差估计值为0.4×0.022+0.6×0.018=0.0196。这样的方法类似于对历史数据做了一个压缩,使得预测结果向分析师预测的方向靠拢。

1.4.3 时间序列估计

时间序列分析同样可以用于市场估计,尤其是对短期的财务和经济变量的预测。时间序列估计量(time-series estimators)通常基于因变量的滞后值以及其他变量做出估计。其具体公式如下所示:

式中 0<θ<1。

对于这个公式,有两种理解方法。第一种方法下,我们可以将该公式看作一个自回归模型(AR),该模型试图用过去的方差波动来解释当前(未来)的方差波动。等式中的可以被看作是一个残差项,通常回归模型都会自带一个残差项。第二种方法下,我们可以将该模型看作是一个加权平均的形式,即我们认为今天的方差波动是由昨天的方差波动以及一个随机扰动项按照一定的加权平均方式得到的。(如果只用昨天的方差波动推导今天的方差波动是不准确的,因为今天的方差波动还受其自身的随机扰动的影响。在这样的加权平均形式下求得的预测结果才是准确的)。

风险聚集(volatility clustering)是指一个较大(较小)的数据波动之后会跟随一连串的较大(较小)的数据波动,即如果昨天市场波动比较大,今天和明天的市场就会有很大的概率继续这一较大的波动。这是因为市场表现具有一定的惯性,是一个持续的过程。由于风险聚集效应的存在,所以在实务中,上述公式的θ值通常会被赋予一个较大的数值,这一数值通常大于0.95。

1.4.4 多因素模型★★★

多因素模型可以被运用于含有多个风险因子的资产收益率的预测。其模型的标准公式如下所示:

Riii,1F1i,2F2+…+βi,kFkεii

式中 βi,k——收益R对于风险因子的敏感程度;

Fk——资产包含的诸多风险因子;

残差项εi——资产特有的风险。

多因素模型的本质是一个多元回归模型,而两因素模型就是一个二元回归模型。如果一只股票的收益率同时受到一国经济总量GDP以及利率水平i的影响,那么上述公示中的F1就为GDP,F2就为i。

分析师用多因素模型做预测,就是通过多因素模型求得资产的收益和方差。分析师在预测资产组合的方差时需要知道组合间的相关系数,于是分析师还需要利用多因素模型估计出资产间的协方差(Cov)。根据多因素模型推导出的资产的方差公式以及资产间的协方差公式如下所示:

何老师说

上述两个公式都可以被严格地推导出来,鉴于推导过程不是我们考试的考点,在此不做赘述。但是鉴于这两个公式形式比较复杂,这里我们介绍一种关于这两个公式的图形记忆方法(见图5-3)。

图5-3 公式的图形示意

如图5-3所示,现在我们要求的资产i收益率Ri与资产j收益率Rj之间的协方差Cov(Ri,Rj)。其中Ri由βi1F1与βi2F2共同决定;我们将它们写于表格的上方。Rj由βj1F1与βj2F2共同决定,我们将它写在表格的左侧。表格中心第一象限中数字便是用βi1乘以βj1再乘以F1与F1之间的协方差(即F1的方差)得到,同理可以求得矩阵中其他3个象限内的数值,将它们全部加总后,就得到了上述协方差公式:

同理,我们还可以用这个矩阵图形法(见图5-4)记忆方差的公式。

图5-4 公式的矩阵图形法示意

如图5-4所示,求解Ri的方差,就等同于求解Ri与Ri之间的协方差。该表格中上方与左侧同时标注了收益率Ri的影响因素βi1F1与βi2F2;表格中4个象限中数字的求解方法与前一个表格中的数字求解方法完全一致。我们将所有象限中的数字相加再加上残差项的方差σ2ε,i便可以得到上述方差的公式

根据上图的矩阵记忆法,我们还可以求得三因素模型下资产的方差和协方差。再次说明,以上讲述的只是帮助大家记忆公式的方法,并不是严格的数学推导过程,这两个公式大家一定要牢记,它们都是CFA三级考试的重点。接下来我们来练习一道多因素模型的例题。

【例题】

基金经理Mary打算在两个市场上做投资,为此她的团队收集到很多数据,并汇总信息如表5-1和表5-2所示。

表5-1 风险因子的协方差矩阵

表5-2 市场的敏感度和残差项

根据上述表格,Marry想要先求得市场1与市场2之间的协方差,以及市场1的方差各是多少?

解答:

表5-1呈现的是风险因子的协方差矩阵,该道例题中有两个风险因子,即“全球股票”(F1)和“全球债券”(F2)。其中,0.0032=Cov(F1,F2),。表5-2反映了不同市场对于“全亚洲股票”以及“全亚洲债券”这两个风险因子的敏感程度β,同时该表格还以残差项的形式给出了不同市场的各自特有的风险。由此依据公式我们可以得到:

这里需要注意的是CFA协会在官方教材中明确规定了“residual risk”代表的是方差,而不是标准差。对此概念,大家一定不能混淆。

何老师说

我们再为大家扩展一些单因素模型的相关知识。单因素模型的本质就是一元回归模型,模型方程如下:

RiiiRMi

单因素模型中影响个股收益率的关键因素就是市场收益率RM,βi代表是大盘对于个股收益的影响程度,。根据上述方程,我们也可以求得与之对应的方差以及协方差:

由此可见,资产收益的方差可以分为两项,这一项反映了大盘收益波动的风险(系统性风险),这一项反映了公司特有的风险(非系统性风险)。

至此,正式工具中的第一大类工具——统计工具我们就都已经全部介绍完毕了,接下来,我们进入正式工具中第二大类工具——现金流折现模型的学习。