第六节 双变量测量的数据处理
直接测量和间接测量的待求量只有一个,而在实际工作中还经常需要在一组测量中同时求出多个变量,叫多变量测量,也称组合测量。当待求量有两个时叫双变量测量,例如电阻R是温度t的函数,当它们满足线性关系时,有R=R0+αt,若能求出R0和α,则两个变量R,t之间的函数关系便确定了。一般地说,若两个变量x,y满足线性关系,为了求出它们的函数关系式y=a+bx,只要求出a和b即可。通常做法是在xi的一系列不同取值下,测得一系列yi值
再根据这n对数据,按一定的数据处理程序得到两个待求量a和b。这个问题实际上是一元线性方程的回归问题。a称为回归常数,b称为回归系数,最常用的数据处理方法有作图法、逐差法和最小二乘法。
一、作图法
1.作图法的特点
作图法具有简单、直观的优点,能方便地显示出函数的极值、拐点、突变或周期等特征;连线的过程有取平均的效果(有时还有助于发现测量错误或问题);作图法具有内插和外延的功能,可以得到某些实验无法测量的数据。作图法的缺点是受图纸大小的限制,一般只有3~4位有效数字,且连线有相当大的主观性。作图法求值比较粗糙,一般不再处理误差或不确定度。
曲线改直。按相关物理量画出的曲线虽然直观,但要判断具体函数关系却比较困难。如果通过适当的变换将曲线形式改成直线,再用作图来分析就方便得多,而且也易于求得有关参数。
2.作图法要点
作图法的要点是,将测量数据在坐标纸上逐一描点,根据观测点的分布趋势连成一条光滑的曲线。对于一元线性函数来说,该图线是一条直线。如图2-5所示,它是某电阻的温度特性图线,求a,b值的所有计算数据都取在图线上,图线是求解的基础,实验者应注意减少作图误差。首先,这条直线应通过观测值的中值点;其次,大部分观测点应该在直线上,其他观测点均匀分布在该直线的两侧。中值点的坐标是。画好图之后,在图线上靠近两端取两个坐标点M1(x1,y1),M2(x2,y2),可算出回归系数
若横轴起点为零,则直线与纵轴交点y0即是回归常数
a=y0
若横轴起点不为零,可用下式计算
或
图2-5 作图法
3.作图的步骤
(1)根据作图的要求,选择坐标纸的尺寸,测量数据的有效数字位数越多,坐标纸的尺寸也应相应增大,实验室推荐尺寸为7.5×10cm2(根据需要也可适当增大或减小)。在坐标纸上画坐标轴,注明单位,标出分度值,坐标轴上的分度值应均匀标定,且以2,5,10等的整倍数为好,分度值的起点不一定是零。
(2)根据观测数据计算出。
(3)根据观测数据,在坐标纸上逐一描点,数据点的符号为+、×、☉等,任选其一。
(4)根据数据点的分布趋势,连结成一条直线。不要画成折线。
(5)在图线上选择“取用点”,根据这两个取用点给出的数据进行回归计算。取用点的横坐标应取成整数,二者距离应尽可能大一些,取用点的符号应与观测点的符号有所区别。
(6)在图纸的适当部位写上图注。内容包括图名、作者、实验日期等,最后将图纸粘贴在实验报告纸的适当部位上。
二、逐差法
在一些特定条件下可以用简单的代数运算来处理一元线性回归问题。逐差法就是其中之一,它比作图法精确,与最小二乘法结果接近,在物理实验中经常使用。一般说来,在n对数据(xi,yi)中任取两对数据都能利用公式求出b值。
1.逐差法选用数据的原则
(1)所有的数据都要用上;
(2)任一数据都不要重复使用。
逐差法规定,把n对数据分成两组,用第二组的一对数据做被减数,用第一组相应的一对数据做减数。例如共10对数据,就将第1~5对数据分为第一组,将第6~10对数据分为第2组,然后第6对与第1对相减,第7对与第2对相减……就是,逐5相减直到,共得到5个bi(i=1,2,3,4,5),最佳值是它们的平均值
回归常数为
的标准不确定度通常可由相应的标准偏差来估计
注意n=k/2是测量次数的一半。如果k为奇数,将首(或尾)测量数据舍弃,然后同上处理。
2.关于逐差法几点说明
(1)逐差法的优点是能充分利用数据,计算也比较简单,且计算时有一定平均效果,还可以绕过一些具有确定值的未知量。
(2)逐差法要求自变量等间隔变化测量,且自变量误差可略去的情况,这时不仅计算比较简单,而且因变量可视作等精度测量。
(3)在用逐差法计算线性函数的系数时,必须把数据分为两半,并对前后两半的对应项进行逐差,不应采用逐项逐差的办法处理数据。后者不能均匀地使用数据,将只计及首尾项的贡献(中间各项互相抵消)使多组测量失去意义。
(4)用逐差法只能处理线性函数或多项式形式的函数。后者需用多次逐差,因为使用很少,精度也低,这里不作介绍。
三、最小二乘法
从含有误差的数据中寻求经验方程或提取参数是实验数据处理的重要内容,也称回归问题。事实上,用作图法获得直线的斜率和截距就是一种平均处理的方法,但这种方法有相当大的主观成分,结果往往因人而异。根据最小二乘法原理进行回归运算的方法称为最小二乘法。用这种方法不仅能准确求出a和b,而且能估算出它们的不确定度,还能检验出这两个变量之间线性关系的符合程度。由于不少袖珍计算器已具备了回归运算的功能,近年来最小二乘法得到了迅速的普及。
1.最小二乘法原理
最小二乘法原理可表述为:一个测量列的最佳值,应使它与测量列中所有测量值的残差的平方和为最小。即测量列x1,x2,…,xn的最佳值如果是A,则第i个测量值xi的残差是vi=xi-A,残差的平方和为最小,可以写成
=min
若A满足上式,则A必是测量列的最佳估计值,即。实际上由上式若对A求偏导就可以得到,间接验证了最小二乘法原理的正确性。
2.回归运算
若n对数据x1,x2,…,xn;y1,y2,…,yn满足线性关系,且没有测量误差,则可写成
然而没有测量误差的假设不能成立,但可以假设xi数列的误差远小于yi数列的误差,因而xi数列的误差可以忽略,而yi数列的误差为vi,则以上方程组应改写成
称为误差方程组。根据最小二乘原理,若a,b是最佳值,则有∑=min,写成
(2-21)
a满足式(2-21)的条件是
b满足式(2-21)的条件是
对以上两式分别求偏导,整理后得到
将,代入上式得
解上述联立方程,得
(2-22)
还应指出的是,求常数项a,一次项系数b的出发点是假设x,y两个变量线性相关,但有时并没有太大的把握判断它们一定线性相关。在这种情况下,还要根据相关系数
(2-23)
的大小来判断是否满足线性关系。可以证明,当r接近1时,x与y两个变量线性相关,当r接近0时,两个变量彼此独立。在用最小二乘法进行回归运算时,应借助带有回归运算功能的袖珍计算器,只要把相关测量数据xi和yi输入计算器,显示屏上能立即显示出a,b和r的量值。
四、双变量测量的数据处理举例
【例2-7】 用牛顿环装置测平凸透镜的曲率半径的公式是
式中,λ=589.3nm,是钠光波长;k是干涉圆环级次;Dk是第k级干涉圆环的直径。
测得的数据如下表:
试用逐差法求透镜的曲率半径R。
解 因为与k满足线性关系,所以对k的变化率,为了用逐差法求b,首先列出~k的数据表:
将k=6.0~10.0分为第一小组,k=11.0~15.0分为第二小组,逐5相减,则
最佳值
由
b=4λR
得
【例2-8】 对x,y进行双变量测量,得8对数据如下
x:1.00,3.00,8.00,10.00,13.00,15.00,17.00,20.00,
y:3.0,4.0,6.0,7.0,8.0,9.0,10.0,11.0
试用最小二乘法求出线性方程。
解法一 手头没有带回归运算功能的计数器,可以用这个方法。
首先使用计算器进行统计运算,得到
相关系数
因为r→1,可以判定x与y线性相关。
回归系数
回归常数
回归方程
y=2.61+0.426x
解法二 用带有回归运算功能的计算器进行回归计算,将xi,yi按一定程序分别输入计算器后,计算器能够将r,a,b的量值直接显示出来(见附录1)。