- 性之变:21世纪中国人的性生活
- 潘绥铭 黄盈盈
- 2988字
- 2020-08-29 17:28:23
1.3 本书依据的三次全国性调查的简介
1.3.1 性社会学的来源与前景
通俗地说,性社会学就是运用社会学的立场、理论与方法来研究人类的性现象。其来源与发展请读者参考笔者的《性社会学》一书。
在中国,性社会学目前是春芽破土。
从意识形态层次来看,一方面众多的性研究由于被认为“太敏感”而无法发表;另一方面,许多被大众所关注的性讨论又往往靠耸人听闻来吸引眼球,仍然停留在20世纪80年代“破禁区”的时事评论的水平上。
从方法论来看,定性研究的成果往往被认为“太暴露”而无法发表,可是调查数据的统计分析却又往往被认为“问题太小”而得不到发表。
从受众的偏好来看,普通大众更关心的是性技巧或者性障碍,关心性方面的社会问题的人毕竟是少数,真正有志于性研究而不仅仅是“性”的人更是凤毛麟角。
但是以发展的眼光来看,性社会学又会很快地走向叶落归根。
这是因为,中国的性文化已经从性革命走向多元化,很快就会走向“自然化”,人们已经高度自由与自觉,不再需要去关注与讨论性的社会学意义上的各种问题。那时候,性社会学将仅仅作为纯粹的学术研究而钻进象牙塔。
因此,性社会学研究者的宿命是:永远的边缘人。
1.3.2 20世纪90年代前后中国的性调查
对中国人的性调查
1985到1989年,潘绥铭通过观察法分析在公园里公开亲昵的异性伴侣的亲昵行为与场景的相互关系模式。1989年,潘绥铭、谭深等人去上海,对参观“油画人体艺术大展”的约19万名上海观众,做了美学的和性学的抽样调查。1989年到1990年,潘绥铭在北京市区进行了“性生活与夫妻满意程度的关系调查”。1991年李银河对当代中国人在性爱与婚姻方面的行为与规范进行了调查,出版了《中国人的性爱与婚姻》。
规模最大也最有影响力的调查主要有以下几种。
1989到1990年,刘达临主持的2万多例中国人的性调查,涉及15个省市、24个地区。这是中国第一次大规模地对性行为、性关系和性观念进行的社会调查。
徐安琪主持的对上海、广州、甘肃和哈尔滨四个省市部分地区的800对夫妻婚姻质量的调查。
2000年、2006年、2010年潘绥铭主持的全国随机抽样调查,详见下文。
对大学生、女性、少数民族、流动人口等的性调查
最近十多年以来,对于大学生的性调查日益增多,已经出版的成果达数十项之多。
女性之性的调查,影响力比较大的是李银河的《中国女性的感情与性》。还有一些调查针对女性的身体与性,网络与女性的身体形象、性表达以及性认同等等。1995年世界妇女大会在北京召开之后,相关调查研究更多地集中于性骚扰和性暴力。对于妇女的生殖健康和性健康的调查则主要集中于人口学和公共卫生领域。
针对少数民族和农村的性研究,零散地见于人类学和民俗学的相关研究之中。
针对流动人口的性调查研究在最近几年开始多起来,其中大部分来自艾滋病研究。
对性产业、女性性工作者的调查研究
潘绥铭较早以“社区考察”的方法调查“红灯区”的发展脉络、形成原因、运作机制、与社会环境的关系等问题。还有一类研究针对劳教所中的女性商业性性服务工作者。另外,尽管在研究伦理上受到质疑,赵铁林对于海南“小姐”生活的拍摄和研究还是在社会上引起了很大的反响。
在预防艾滋病项目的支持下,公共卫生领域针对女性性工作者的研究开始多起来。
对同性恋、跨性别的调查研究
李银河和王小波的《他们的世界——中国男同性恋群落透视》(1992)以及后来李银河的《同性恋亚文化》(1998)在社会上引起了比较大的反响。1993年,作为预防艾滋病项目,潘绥铭进行了“男性同性恋社交中的性关系与性行为调查”。
张北川的著作《同性爱》(1994)以及后续工作,社会影响颇大。
最近几年,预防艾滋病的项目极大地推动了对于中国的MSM(男男性行为者)的研究,其中包括MB(男性性工作者)的。例如:高燕宁主编了《男同性恋健康干预》一书(2006);童戈的《中国人的男男性行为:性与自我认同状态调查》(2005)展现中国大陆“男同志”群体的性实践和性认同。针对拉拉(女同性恋)的研究、酷儿研究、跨性别的研究在最近几年也崭露头角。
对某些性现象的研究
还有学者对换妻、多伴侣、一夜情等等进行过调查。
1.3.3 本书依据的三次全国性调查
三次成年人性调查
在潘绥铭教授的主持下,中国人民大学性社会学研究所于2000年、2006年和2010年进行了“中国人的性”总人口随机抽样调查。
调查对象是中国境内18到61岁、会讲汉语、能识汉字的总人口。以城乡差异、人口规模与离婚率等国家统计数据为分层指标进行多层等概率抽样。
初级抽样单位(PSU)为县级行政区域。终端调查点为城市社区与农村的行政村。在每个终端调查点中,按照居住者的总名单进行等距抽样,再按照地理位置抽样法抽取流动人口。
由于性调查的高度敏感性,调查者采用了如下实地调查方法。
不进行“入户抽样”:不在家中访谈,而是直接抽样到个人,邀请被访者到调查员事先准备好的访谈室来。
在封闭空间中访谈:保证每个访谈室中只有调查员与被访者两个人。
同性别、一对一地访谈:禁止调查员访谈异性。
调查员与被访者素未谋面:组长上门动员、预邀而且不进行访谈;调查员不可能知道被访者的情况。
获得被访者的“知情同意”:在访谈开始之前就明确告知被访者,要询问有关性生活的问题,而且允许拒绝回答任何一个问题或者中途退出。
使用电脑问卷进行访谈:把调查问卷制成电脑程序,调查员携带笔记本电脑到当地,在调查员教导之后,由被访者通过按键盘来独自完成问卷。这是目前国际公认的最接近真实的方法。
对14到17岁全国少年的性调查
此外,在潘绥铭教授的领导下,中国人民大学性社会学研究所于2010年4月到9月在与成年人性调查相同的终端调查点中,随机抽样调查了全国14到17岁的总人口。其重大意义是:包括不上学的、已经工作的与来自农村的流动青少年。但是由于年龄段和问卷内容不尽相同,因此只能有选择地与成年人进行对比。
国内对于青少年的性调查已经有一些,但是基本上都是在学校里调查在校生。与此相对,该次调查的创新意义在于以下几点。
对全国14到17岁的总人口具有总体代表性,优于任何非随机抽样的或局部的调查。
涵盖了全国各种少年的总体,而不仅仅是在校生:包括失学辍学的8.4%、毕业后不再上学的11.1%,总计占到19.5%。按照工作状况来看,目前不工作的占6.0%,正在城市里工作的(包括进城打工的)占10.3%,正在从事农业生产的占3.2%。这些少年样本都是以往调查所缺失的。
实现了最强的保密性。笔者在学校之外进行调查,采用同性别、一对一、在封闭空间中、使用笔记本电脑由被访者通过按键盘来独自完成问卷等措施。
最充分地贯彻了社会调查的伦理原则。在访谈开始之前就明确告知被访少年,要询问性方面的问题,而且允许拒绝回答任何一个问题或者中途退出。为此专门设置了7个问题,都是:“下面调查员将要询问××方面的问题,您愿意回答吗?”如果被访少年选择“不愿意”,则电脑程序自动跳过该部分的所有问题。调查也允许家长一起来,但是调查开始后家长必须退出访谈室。
在电脑问卷中使用技术手段设置了测谎功能与回答条件的限定。
上述措施最大限度地减少了被访少年的顾虑与失误,保证了最高的调查质量。
1.3.4 统计分析的设计
笔者严格遵循了问卷设计、调查实施和统计分析的学术规范。此外,还有一些特色可以总结如下。
备选答案的设计
笔者的调查问卷中的大多数变量都是属性变量,不是也不可能是连续变量。
这种情况是笔者与美国合作者共同选择的,具有“论方法”层次上的重要意义。因为越是追求连续变量的回答,就越容易迫使被调查者不得不谎答或者拒答。例如,对于每月性生活次数这类提问,连续变量当然最好用,但是究竟有多少中国人能够精确记得或者当场计算出来呢?中国人又不善于直接拒绝,结果不得不乱答一气。这还不如划定“两三次、四五次”这样的分类,对方才可能回答得更准确更真实。
早在20世纪80年代笔者刚刚开始研究性问题的时候,曾经设计过“在每10次性生活中您有几次性高潮”这样的提问而且据此写了论文。但是在1993年美国的一个学术会议上宣读后,有学者指出:这样的问题人们很难准确回答。后来笔者在自己的调查实践中也日益体会到:这种追求量化、追求精确的企图,其实是由于不够了解生活与人性而产生的偏差。
在笔者的问卷中,经典的“三级定序排列题”(例如:多、不多不少、少)都被改变为“两极强制选择题”(是、否),“五级题”则被改造为“四级题”(没有“中间状态”的选项)。这也是深思熟虑之后的选择,因为长期的调查经验告诉笔者:只要列出“中间状态”或者“无所谓”的选项,就一定会有比例惊人的中国人选择它,在观念提问中尤甚。当然,笔者的这种“强制选择题”必须有这样的前提:第一,被调查者对题意有共识;第二,被调查者都关心此问题;第三,允许拒答而且预计其比例不高。
历史可比性的解释
笔者所进行的成年人调查并不是跟踪调查,因此笔者这样来论证三者之间的可比性。
第一,从随机抽样的角度来看,调查都足以代表中国该年龄段的总人口。尤其是其中2006年和2010年的调查,使用的是同一个抽样框,直到居委会或村的最终抽样点和抽样方法都完全一致,这可以加强两者之间的可比性。至于直接落实到个人的那种严格的追踪调查,笔者认为它根本就不可能适用于任何对于敏感问题的社会调查。因为“性”的调查不得不匿名,可是既然是匿名调查,怎么可能第二次找到原来的被调查者呢?
第二,笔者在进行回归统计分析时,每次都把2006年调查和2010年调查与2000年调查之间的整体差异,作为自变量纳入分析。这就控制住了不同调查可能产生的影响,最大限度地提高了调查之间的可比性。在本书对于回归分析的控制变量的每一个注释中,均简称之为“调查差异”。
第三,2000年的年龄段整体上略大于2006年与2010年,但是相关分析表明不存在显著的差异。
加权依据
除了特殊注明的以外,本书所有的统计分析,都是复杂样本(complexsample)的加权计算,其分层为2(农村与城市),单位(初级抽样单位PSU)最多为283个。样本的权数是城乡分层、PSU、性别、年龄,下文中不再一一说明。由于在2000年和2006年的统计分析中使用的是直接加权方法,统计结果略有不同,现在的复杂加权是进一步的精确化。
此外,笔者在写作本书的时候,国家的2010年人口调查数据尚未发布,因此本书中所有关于2010年的统计分析,都是按照《中国人口和就业统计年鉴2009》进行复杂加权的。今后笔者新发表的论文,很可能使用2010年人口调查的数据进行复杂加权,那时候的各种数字很可能于本书的数字有所不同,敬请读者注意。
统计分析方法的选择
本书所依据的全国调查的随机抽样误差均不超过5%,均以“成年人的多伴侣发生率”或“少年的性交发生率”为目标变量,通过了信度与效度检验。
笔者的统计学基础较差,在美国合作者的推荐之下,本书中的相关分析,除了一些非常直观的情况使用双因素的交叉表分析之外,主要是使用PASW Statistics18.0(就是原来的SPSS)软件进行多元线性回归分析或者Logistic回归分析。
笔者采用的是探索式的“沙里淘金”的方法,就是把所有的变量都纳入模型,然后逐步剔除所有不显著相关的变量,只保留那些显著相关(p<0.050)的变量。这种方法是有争议的。因此需要多说两句。
经典的统计学要求,纳入回归分析的变量应该数量少而且假设非常清晰明确,或者要求在一个既有的模型之上再增加很少的几个变量,以便检验其显著性。这当然是“假设—经验”的经典做法,而且已经成为一种学术规范。
但是笔者更加希望采用探索式的回归分析,其理由有三。
其一,目前在性研究的领域中,成熟的假设非常之少,经过检验的模型更为罕见,而且抽样方法与调查方法千差万别,基本不具有可比性,所以如果勉强采用经典的分析方法,反而有削足适履之嫌。
其二,笔者的整个问卷其实只有一个因变量,那就是“全性”的可测量状态。问卷中的任何一个提问都是经过通盘设计的,都假设它们与“全性”相关。因此笔者可以而且应该在回归分析“全性”的任何一个因素的时候,把全部变量都投入进去。从笔者提倡的“论方法”的视角来看,这种操作方法就是在问卷调查的局限条件下试图贯彻定性调查中的“扎根理论”,尽可能地从全部材料中提取自己的认知。这种方法当然是不成熟的,也是可以争议的,但是笔者认为应该且可以朝着两种方法论的整合努力靠近一步。
其三,笔者深知,那些不显著相关的变量也蕴含着丰富的信息,尤其是其中那些有悖常识的相关关系,往往能够揭示出更有意思的情况。但是这在操作上过于困难了,因为笔者首先就需要论证某种常识确实是作为常识而存在,而且必须是存在于笔者的三次调查的具体时空之中与具体对象的生活实践之中,然后才可能对那些不显著相关的变量做出解释。这恐怕已经是另外一个大规模的完整研究了。即使笔者可以完成,也很难纳入本书。
统计分析过程的表述
在本书使用最多的Logistic回归分析中,因变量与自变量均已进行了转换处理,生成了虚拟变量。但是为了节省篇幅,其过程不再列出。
本书作为性社会学的专著,本应该把统计分析的过程与中间环节尽可能详细地公布出来。但是笔者希望有更多的普通读者能够不讨厌这本书,因此不再列出所有的标准差与标准误,也不再列出回归分析中的控制变量的细节和估计值的95%置信区间。在完稿之前的最后一分钟,还割爱了大约1/4的统计表格或其栏目。
笔者要对非专业的读者提醒一句:在本书的所有关于回归分析结果的表格中,“估计值”或“估计”这一栏说的都是发生该现象的可能性(而不是真的发生了),因此“发生可能性”的数值,不同于两个“实际发生率”之间直接加减的计算结果。
本书涵盖了调查问卷中的所有提问,只不过其中某些行为的首次年龄与上年次数由于样本相对过少损害了代表性而没有列出其统计结果。
不做什么?
从统计学来看,有了3次调查的结果,应该可以做出某些预测;但是笔者决然拒绝。这是因为对社会与人的发展所做出的任何预测,无论它具有多么大的数学上的逻辑合理性,也很可能不符合生活的逻辑,更无法在社会实践的层次上进行证伪。
从吸引眼球的角度来看,把中国的情况与外国进行对比,这是一个诱惑力超强的主意;但是笔者也弃之不顾。因为这种跨国比较的可比性基本上无法进行检验。通俗地说,如果两个国家的调查方法不一致,那么强行进行任何比较都只能是自欺欺人。
最后的定位
最后,从统计分析的角度来说,笔者把本书的追求定位于:与其在技术上好高骛远,不如在思路上独出心裁;与其在细节上精益求精,不如在分析中入木三分;与其在叙述中循规蹈矩,不如在讨论中发人深省。
再高级的统计方法也无法自动给出社会学意义上的解释,因此笔者在本书的数据分析的表述中经常使用多侧面的和不确定的语态。笔者唯有寄希望于在今后的定性研究中对于中国人的“性”得出更加全面深入的理解。
1.3.5 调查的总体情况
上述全国调查的操作方法的细节,笔者在2004年社会科学文献出版社出版的《当代中国人的性行为与性关系》中写下两万多字的详细叙述。随后在2006年与2010年进行的后续调查中,一直严格遵照同样的调查方法。读者可以参阅该书,这里不再赘述。三次全国随机抽样调查情况见表1—1、表1—2。
表1—1 三次调查简介
注:如果调查对象的文化水平不足以自填,则由调查员直接询问。这种情况主要发生在农村老年妇女中。
如果调查对象不存在某些情况,电脑就会自动跳答,因此提问的最小数量是每个人必答的,最大数量则是全部情况都有的人的回答上限。
表1—2 三次调查的复杂加权样本情况(%)
注:上学程度是指调查对象是否上过小学、初中、高中、大专等,并不意味着其拥有相应的学历,故不用“教育程度”来表述。流动人口的定义是,在当地居住不足4周年的人。
2010年的调查总体(见表1—3):根据前述全国人口调查数据,到2008年年底,中国14~61岁的人占总人口的72.07%。我国人口与计划生育委员会预计2010年的人口总数将不超过13.7亿。因此,这个年龄段的中国人口的推算总数应该约9.874亿人。也就是说,笔者的随机抽样可以代表这样的大约10亿中国人。
表1—3 2010年调查的初级抽样单位(PSU,县级抽样点)
续前表
注:2006年的PSU是120个,2010年由于经费有限,只能保留其中的103个。