- 北京市第二次群众体育现状调查与研究
- 李丽莉
- 1658字
- 2020-06-24 20:24:23
四、数据处理
问卷收集、审核后,进入数据处理阶段,主要包括数据录入、数据审核、数据清理和数据分析。每一阶段主要进行的工作如下。
(一)数据录入
数据录入是数据处理的基础,建立一个好的数据文件,为后续的数据分析打下一个坚实的基础。本次数据录入包括对区县体育局调查的20份问卷、对街道办事处调查的318份问卷、对居民个人调查的13191份问卷,共计13529份问卷。
将问卷数据录入计算机的过程中,主要进行如下工作:(1)数据分析负责人首先根据问卷建立数据文件。对区县体育局、街道办事处调查的问卷以及居民个人问卷使用Excel进行数据录入,分别建立Excel文件;(2)建立Spss文件,主要是定义变量,包括变量名、数据类型、变量值及其标签以及测度水平。将变量定义信息分发给每名录入员;(3)对录入人员的培训。本次录入数据工作是首都体育学院2008级社会体育研究方向的研究生完成的。在录入数据前,数据分析负责人对录入员进行了录入数据的培训;(4)问卷编号。录入分组负责制,2人一组,负责1~2个区县的问卷录入。录入地点是首都体育学院计算机房3教室。每次录入员录入数据时都要进行登记。数据录入后,由数据录入组组长负责数据录入的检查,审核每个区县录入数据量是否与实际收集的问卷数一致。每个区县的数据录入工作完成后,由专人负责,将所有区县数据进行归纳、合并,并进行文件的复制,将结果交给数据分析负责人。
(二)数据审核
1.对区县体育局问卷的数据审核
该问卷共有20份,每个区县体育局填写一份问卷。数据审核工作由数据分析组的人员负责。审核工作是将问卷与录入数据逐项进行百分之百的全面核对。将核对好的数据按照每个问题进行归纳汇总。
2.对居民个人问卷的数据审核
数据的审核采用初审和全面复核。初审主要包括2个方面:一是审核数据录入是否正确。主要由数据分析负责小组审核录入数据是否正确,采用对每个区县按10%比例进行随机抽查,发现录入问题及时进行记录,然后由录入员对错误数据进行更正;二是审核填写是否有逻辑上的错误。主要是针对问卷中填写不正确的或有疑问的地方通过打电话询问调查员进行核对。错误比较多的有的作为废卷处理,有的通过重填的方式进行校正。全面复核是通过逻辑检查和使用Spss的Analyze的Descriptive Statistics过程中的Frequencies过程进行。输出结果中如果与变量值不相符的,及时进行纠正。通过数据的审核保证数据的质量。
(三)数据清理
对于经常参加体育锻炼人群的定义是,根据居民个人问卷第二部分的第18、19、21题进行定义,重新建立一个变量,即体育锻炼频次。该变量的变量值为3,代表从不参加体育锻炼者;变量值为2,表示偶尔参加体育锻炼;变量值为1,代表经常参加体育锻炼。在参加体育锻炼人群中,将同时满足每次体育活动30分钟以上者、每周参加体育锻炼3次及以上者、每次活动强度自我感觉在中等及以上者定义为经常参加体育锻炼;将参加了体育活动的,但不能同时满足这3个条件的,定义为偶尔参加体育锻炼。
(四)加权处理
由于抽样中主要关注对各个区县的调查,城乡之间样本的比例与北京市总的城乡比例不一致,在判断北京市居民经常参加体育锻炼的百分比时,通过城乡比例加权,由样本数据推断总体,从而估计北京市居民经常参加体育锻炼的百分比。
(五)数据分析
本次研究报告的数据是使用Spss软件对数据进行统计处理的。本次报告的数据分析结果主要是针对北京市居民个人群众体育调查现状的分析。具体包括:(1)针对居民个人调查样本数据,通过Spss中的分析过程,选择描述统计选项过程中的频数分析,对每个变量进行频数分析;(2)针对居民个人调查样本数据,通过Spss中的分析过程,选择描述统计选项过程中的交叉列联表分析,进行城乡间不同变量的描述统计;(3)针对居民个人调查样本数据,通过Spss中的分析过程,选择描述统计选项过程中的交叉列联表,对男性、女性的不同变量进行描述统计分析;(4)通过每次体育活动时间、每周体育锻炼次数和每次活动强度的自我感觉3个指标,再生体育锻炼人群类型指标,从而了解经常参加体育锻炼人群、偶尔参加体育锻炼人群和从不参加体育锻炼人群。并通过城乡比例加权,对经常参加体育锻炼人群百分比进行推断。