当前位置:主页 > 公共卫生 > 文章内容

相关回归分析(1)

作者:admin发布时间:2011-06-29 08:58浏览:

第二十二章 相关回归分析

  提要 相关回归的意义,原理;小样本的直线相关和回归分析;相关系数和回归系数的意义及假设检验;应用直线相关和回归分析时的注意事项。

  在医学上,许多现象之间都存在着相互联系,例如身高与体重,体温与脉搏,年龄与血压,钉螺与血吸虫感染等。而有些事物的关系是互为因果的,如上述钉螺是因,感染血吸虫是果;但有时回果不清,只是伴随关系。例如父母的兄弟,兄高,弟也可能高,但不能说兄是因、弟是果,这里不是因果关系,而可能与社会条件、家庭经济、营养、 遗传等因素有关。

  相关是解决客观事物或现象相互关系密切程度的问题,而回归则是用函数的形式表示出因果关系。有相关不一定因果关系;反之,有因果关系的,一定有相关。我们称“因”的变量叫,习惯上用Y表示。以横轴代表自变量X,纵轴代表依变量Y,可以将一群观察事物的两种关系在坐标图上以P(X,Y)的方法定位,作出一群点图,便可在体上看出两者的关系,例如图22-1。

  图22-1(A)表示血压(依变量)随年龄(自变量)增长而增高,其图像性质与(B)一样称正相关(positive correlation);图(C)的依变量随自变量的增加而减少,称为负相关(negative correlation);若二者没有关系,则称无相关(如图D、E、F)。

图22-1 年龄与血压相关(A)和五种有代表性点图(B~F)

  根据实际资料,用数学的方法求出一条曲线(或直线),使我们能够从一个自变数推算出相关的依变量的值,这条线就叫回归线。回归线有直线和曲线两种。本章仅介绍直线相关与回归分析。

  例22.1 某产科医师发现产妇尿液中雌三醇含量与初生儿体重有相关现象,因此检查了31例待产妇24小时的尿雌三醇含量,并记录下各产儿初生体重,统计如表22-1。作者意欲通过测定尿中雌三醇含量以间接预测初生儿体重,以便对低出生体重儿采取预防性措施。

  表22-1 待产妇尿雌三醇含量与初生儿体重统计

编号(1) 尿雌三醇mg/24h(2) 初生儿体重kg(3) 编号(1) 尿雌三醇mg/24h(2) 初生儿体重kg(3) 1 7 2.5 17 17 3.2 2 9 2.5 18 25 3.2 3 9 2.5 19 27 3.4 4 12 2.7 20 15 3.4 5 14 2.7 21 15 3.4 6 16 2.7 22 15 3.5 7 16 2.4 23 16 3.5 8 14 3.0 24 19 3.4 9 16 3.0 25 18 3.5 10 16 3.1 26 17 3.6 11 17 3.0 27 18 3.7 12 19 3.1 28 20 3.8 13 21 3.0 29 22 4.0 14 24 2.8 30 25 3.9 15 15 3.2 31 24 4.3 16 16 3.2      

  资料来源:Rosner B:Fundamentals of Biostatistics P.346,Duxbury Press,1982

  一、相关分析(correlation analysis)

  先将上表数据按直角坐标作出图22-2。从该图的点子分布可以看出,尿中雌三醇浓度愈高,新生儿体重愈大;这群点子的分布基本上呈直线趋势。

图22-2 待产妇尿雌三醇含量与产儿出生体重相关图

  (一)相关系数(correlation coefficient)

  相关系数是表示两个变量(X,Y)之间线性关系密切程度的指标,用r表示,其值在-1至+1间。如两者呈正相关,r呈正值,r=1时为完全正相关;如两者呈负相关则r呈负值,而r=-1时为完全负相关。完全正相关或负相关时,所有图点都在直线回归线上;点子的分布在直线回归线上下越离散,r的绝对值越小。当例数相等时,相关系数的绝对值越接近1,相关越密切;越接近于0,相关越不密切。当r=0时,说明X和Y两个变量之间无直线关系。计算相关系数的公式为:

  为了获得公式22.2中各数据,先将表22-1资料进行计算如表22-2。

  从表22-2的计算获得

  ΣX=534 ΣX2=9876 ΣY=99.2 ΣY2=324.18 ΣXY=1750

  N=31

  按这些数据进一步以下演算求r。

  (二)相关系数的假设检验

  本例题31例,只是总体中一个样本,由此求得的相关系数,必然存在抽样误差。总体相关系数为零(ρ=0)时,从这总体中抽出31例,因为抽样误差,r也可能不等于0。氙以要判断该样本r是否有意义,需与总体相关系数,ρ=0比较,看两者的差别有无统计不学意义。

  相关系数的假设检验,可用t检验,公式如下:

    公式(22.2)

  自由度v=n-2

  H0:ρ=0

  H1:ρ≠0

  α=0.05

  本例r=0.6097,n=31,代入公式(22.2)

  表22-2 相关系数计算表

尿雌三醇X(mg/24h)(1) X2(2) 初生儿体重Y(kg)(3) Y2(4) XY(5) 7 49 2.5 6.25 17.5 9 81 2.5 6.25 22.5 9 81 2.5 6.25 22.5 12 144 2.7 7.29 32.4