1.1.1 先单后多

最常见的变量筛选方法是先单后多,即先进行单因素分析,再将单因素分析“有意义”的变量一起,纳入多因素模型。这样操作最为简单,并且在大多数情况下是可行的。然而,在某些情况下,先单后多存在一定局限。例如,自变量数目过多,自变量间存在共线性,或者缺失值较多而不愿舍弃掉含有缺失值的样本。

除此之外,先单后多自身也存在一定的争议。例如,对于单因素分析“有意义”的变量,不同人也有不同的理解:有人认为单因素分析p<0.05,即“有意义”;而其他人认为p<0.1或p<0.2,即“有意义”;更甚者认为无论p值如何,只要临床上认为其与结局存在关系,便可认为其“有意义”。

注意:本书如未做特殊说明,均认为p<0.05“有意义”。