当前位置:主页 > 其他科室疾病 > 文章内容

计量数据分析--第一节 集中趋势指标(2)

作者:admin发布时间:2011-06-29 08:23浏览:

16 2800 176~ 177 8 1416 178~ 179 8 1432 180~ 181 3 543 182~184 183 2 366 合计   110(Σf) 19000(ΣfX)

  (一)直接法

  当观察值个数n不多时,直接将n个观察值(X1,X2,……Xn)的乘积开n次方。其计算公式为:

  公式(18.3)

  其对数形式:

  公式(18.4)

  例18.3 设有6份血清的抗体效价为1:10,1:20,1:40,1:80,1:80,1:160。求其平均效价。

  本例可将各抗体效价的倒数代入公式(18.4),求平均效价数的倒数。

  该6份血清的平均抗体效价为1:45。

  (二)加权法

  当观察值个数n较多时,先将观察值分组归纳成频数表,再用公式(18.5)计算。

  公式(18.5)

  式中,X为各组段的效价或滴度的倒数(等比级数资料时)或各组段的组中值(对数正态分布资料时);f 为各组段所对应频数。

  例18.430名麻疹易感儿童接种麻疹疫苗一个月后,血凝抑制抗体滴度如表18-3第(1)、(2)栏,试求其平均抗体滴度。

  30名麻疹易感儿童免疫后的平均血凝抑制滴度为1:48.5。

  三、中位数(median)

  中位数是一组按大小顺序排列的观察值中位次居中的数值,用M表示。它常用于描述偏态分布资料的集中趋势。中位数不受个别特小或特大观察值的影响,特别是分布末端无确定数据不能求均数和几何均数,但可求中位数。计算方法有:

表18-3 平均抗体滴度计算表

抗体滴度(1) 人数f(2) 滴度倒数X(3) lgX(4) flgX(5)=(2)×(4) 1:8 2 8 0.9031 1.8062 1:16 6 16 1.2041 7.2246 1:32 5 32 1.5051 7.5255 1:64 10 64 1.8062 18.0620 1:128 4 128 2.1072 8.4288 1:256 2 256 2.4082 4.8164 1:512 1 512 2.7093 2.7093 合计 30(Σf) 50.5728(ΣflgX)

  (一)直接法

  当n较小时,可直接由原始数据求中位数。先将观察值由小到大按顺序排列,再按公式(18.6)或公式(18.7)计算。

  公式(18.6)

  (n为偶数时)  公式(18.7)

  式中,n 为观察值的总个数,X的右下标(n+1/2)、(n/2)、和(n/2+1)为有序数列中观察值的位次,X(n+1/2)、X(n/2)和X(n/2+1)为相应位次上的观察值。

  例18.5 某病患者9名,其发病的潜伏期顺序为2,3,3,3,4,5,6,9,16天,求中位数。

  本例n=9,为奇数,按公式(18.6)计算

  若上例在第20天又发现一例患者,则患者数增为10名,n为偶数,按公式(18.7)计算

  (二)频数表法

  当n较大时,先将观察值分组归纳成频数表,再按组段由小到大计算累计频数和累计频率。如表18-4中的(3)、(4)两栏,然后按公式(18.8)计算。

  公式(18.8)

  式中,L为中位数(即累计频率为50%)所在组段的下限;i为该组段的组距;f为该组段的频数;ΣfL为小于L的各组段的累计频数;n为总例数。

  例18.6 求表18-4中数据的中位数

表18-4 164名食物中毒潜伏期的中位数和百分位数*计算表

潜伏期(小时 )

(1) 人数f

(2) 累计频数(Σf)

(3) 累计频率(%)

(4) 0~ 25 25 15.2 12~ 58 83 50.6 24~ 40 123 75.0 36~ 23 146 89.0 48~ 12 158 96.3 60~ 5 163 99.4 72~84 1 164 100.0

  *百分位数的意义与计算见后面的[附].

  由表18-4可见,50%在“12~”组段内,则L=12,i=12,f=58,ΣfL=25,n=164,按式(18.8)计算

  M=L+i/f(n/2-ΣfL)=12+12/58(164/2-25)=23.8(小时)

  [附]百分位数:百分位数是一个位置指标,用Px表示。当P1,P2,……,P98,P99确定后,一个由小到大的有序数列即被分为100等份,各含1%的观察值。百分位数常用于描述一组偏态分布资料在某百分位置上的水平及确定偏态分布资料的医学正常值范围。第50百分位数(P50)也就是中位数,所以,中位数也是一个特定的百分位数。计算百分位数用公式(18.9)

  Px=L+i/fx(n.x%-ΣfL)公式(18.9)

  式中,L、i、fx分别为Px所在组段的下限、组距和频数;ΣfL为小于L的各级段的累计频数。

  例18.7 求表18-4中数据的P95。

  求P95时,x=95,即累计频率为95%所在组段。本例为“48~”组段,则L=48,i=12,fx=12,ΣfL=146,n=164,代入公式、(18.9)

  P95=48+12/12(164×95%-146)=57.8(小时)