網站首頁
醫(yī)師
藥師
護士
衛(wèi)生資格
高級職稱
住院醫(yī)師
畜牧獸醫(yī)
醫(yī)學考研
醫(yī)學論文
醫(yī)學會議
考試寶典
網校
論壇
招聘
最新更新
網站地圖
中醫(yī)理論中醫(yī)臨床診治中醫(yī)藥術語標準中國方劑數據庫中醫(yī)疾病數據庫OCT說明書不良反應中草藥圖譜藥物數據藥學下載
您現(xiàn)在的位置: 醫(yī)學全在線 > 中醫(yī)理論 > 中醫(yī)書籍 > 正文:第一節(jié) 抽樣誤差與標準誤
    

醫(yī)學統(tǒng)計學:第一節(jié) 抽樣誤差與標準誤

一、抽樣誤差的意義在第一章第二節(jié)曾提到過樣本與總體以及抽樣誤差的概念,那里談到,由于存在人與人之間的個體差異,即使從同一總體用同樣方法隨機抽取例數相同的一些樣本,各樣本算得的某種指標,如平均數(或率),通常也參差不齊存在一定的差異。樣本指標與相應的總…

一、抽樣誤差的意義

在第一章第二節(jié)曾提到過樣本與總體以及抽樣誤差的概念,那里談到,由于存在人與人之間的個體差異,即使從同一總體用同樣方法隨機抽取例數相同的一些樣本,各樣本算得的某種指標,如平均數(或率),通常也參差不齊存在一定的差異。樣本指標與相應的總體指標之間有或多或少的相差,這一點是不難理解的。如某醫(yī)生從某地抽了120名12歲男孩,測量其身高,計算出均數為143.10cm,若再從該地抽120名12歲男孩,其平均身高未必仍等于143.10cm,也不一定恰好等于某市12歲男孩身高的總體均數,這種差異,即由于抽樣而帶來的樣本與總體間的誤差,統(tǒng)計上叫抽樣波動或抽樣誤差。

抽樣誤差和系統(tǒng)誤差不一樣,關系系統(tǒng)誤差,當人們一旦發(fā)現(xiàn)它之后,是可能找到產生原因而采取一定措施加以糾正的,抽樣誤差則無法避免。因為客觀上既然存在個體差異,那么剛巧這一樣本中多抽到幾例數值大些的,所求樣本均數就會稍大,另一樣本多抽到幾例數值小些,該樣本均數就會稍小,這是不言而喻的。

抽樣誤差既是樣本指標與總體指標之間的誤差,那么抽樣誤差小就表示從樣本算得的平均數或率與總體的較接近,有樣本代表總體說明其特征的可靠性亦大。但是,通?傮w均數或總體率我們并不知道,所以抽樣誤差的數量大小,不能直觀地加以說明,只能通過抽樣實驗來了解抽樣誤差的規(guī)律性。

二、標準誤及其計算

為了表示個體差異的大小,或者說表示某一變量變異程度的大小,可計算標準差等變異指標來說明,現(xiàn)在我們要表示抽樣誤差的大小,如要問,從同一總體抽取類似的許多樣本,各樣本均數(或各率)之間的變異程度如何?也可用變異指標來說明。這種指標是:

(一)均數的標準誤 為了表示均數的抽樣誤差大小如何,用的一種指標稱為均數的標準誤。我們以樣本均數為變量,求出它們的標準差即可表示其變異程度,所以將樣本均數這“標準差”定名為均數的標準誤,簡稱標準誤,以區(qū)別于通常所說的標準差。標準差表示個體值的散布情形,而標準誤則說明樣本均數的參差情況,兩者不能混淆。下面用抽樣實驗進一步說明之。

將100名正常人的紅細胞數(萬/mm3)寫在100顆大小均勻的豌豆上。這些紅細胞數見表6.1,其均數為500,標準差為43。把這些豌豆放在一個口袋里,徹底混勻后取出一顆,記下紅細胞數,放回袋內,混勻后再取出一顆,記下數字后再放回去,如此繼續(xù)下去,這是一個取不完的總體,這樣每取10個數字作為一個樣本,共抽取了一百個樣本,并計算每一樣本的均數與標準差,例見表6.2。

表6.1 紅細胞數抽樣實驗用的正態(tài)總體

μ=500 σ=43(單位:萬/立方厘米)

383410422429430431435442442444
445449450452455456459461462463
465466468469470471472473476477
478479480481482484485486487488
489491492493494495496497498499
500501502503504505506507508509
511512513514515516518519520521
522523524527528529530531532534
535537538539541544545548550551
555556558565569578590599600617

表6.2 紅細胞數抽樣實驗中的樣本舉例

樣本號紅細胞數(萬/立方毫米),XXS
1383599534442435486478476509544488.661.65
2503506520503489410528488509527498.333.97
3478463617544498485496462482569509.450.96
4529465535473531532556521459383498.452.63
5442493462527520519521512482471494.929.51

第一號樣本均數與標準差的計算:

X=4.886/10=488.6

將一百個樣本均數加總,得到的數值為50,096.7,又這一百個樣本均數平方之和為25,114,830.91,于是代入標準差的計算公式,求得一百個樣本均數的標準差又稱標準誤為

當總體標準差已知時,可計算理論的標準誤σχ,公式是

(6.1)

表6.1抽樣實驗用的總體標準差是43,每個樣本的例數是10,代入公式得

可見由一百個樣本均數求得的標準誤13.50與理論的標準誤13.60比較接近。

在實際工作中,總體標準差往往并不知道,也不象抽樣實驗那樣從同一總體隨機抽取n相等的許多樣本,而是只有手頭一個樣本。在此情況下,只能以樣本標準差S作為總體標準差σ的估計值。這樣,公式6.1中的σ就要用S代替,σχ改為Sχ,以資區(qū)別。

(6.2)

將第1號樣本的標準差及例數代入式6.2,得

再若將第2號樣本的數字代入,Sχ將成為10.74,余類推。由于不同樣本的標準差并不相等,可見Sχ也有抽樣波動,這一點是值得注意的,但它仍不失為σχ的較好估計值。

以上介紹了求標準誤的三種方法,其實我們平常用的只是式6.2,而通過前兩種方法的對比則可使我們明瞭標準誤的含義。標準誤是描述樣本均數變異情況的一個指標,它的大小與總體標準差σ(一般只能用S估計)成正比,而與樣本含量n的平方根m.52667788.cn/rencai/成反比,因此若標準差小或樣本含量大時,求出的標準誤就。藴收`小表示樣本均數與總體均數較接近),X代表μ較可靠,所以假若手頭資料中觀察值的變異程度較大(S大)時,為了保

證樣本代表總體比較可靠,就得適當增大樣本含量(n)。

(二)率的標準誤 若總體包括某事件的發(fā)生數與未發(fā)生數兩類,所化成的比例或成數即為總體發(fā)生率(符號π)與未發(fā)生率(1-π)。從總體中隨機抽取許多樣本(n相等),算出各個樣本率(用P表示),會是或大或小有波動的。為了表示樣本率之間或樣本率與總體率之間的差異程度,當總體率π已知時,可計算理論的標誤σp,其公式是

(6.3)

實際工作中往往不知道總體率π這時只能以樣本率P作為總體率π的估計值,求得率的標準誤,并用SP表示,計算公式為

(6.4)

現(xiàn)舉例說明其求法。

例6.1 某醫(yī)生檢測了110名成年健康人的尿紫質,發(fā)現(xiàn)陽性者11人,陰性者99人,于是算得陽性率P及率的標準誤SP如下:

P=11/110×100%=10%。ㄓ眯当硎緸0.10)

若要進一步增強樣本率估計總體率的可靠性,可加大樣本含量。

三、樣本均數的分布

從同一總體里隨機抽取n相同的許多樣本,這些樣本均數吳正態(tài)分布。如前面所述正常人紅細胞數的抽樣實驗中已求得100個樣本均數,其中多數與總體均數μ比較接近而集中分布在其周圍,且左右基本對稱,見表6.3(此表由表6.4中的100個均數劃記歸組而得)。

表6.3 紅細胞抽樣實驗中100個樣本均數的分布

組 段460-470-480-490-500-510-520-530-540-合計
樣本數1318282813711100

表6.4 一百個樣本的均數、標準差、95%可信區(qū)間

樣本號均數標準差95%可信區(qū)間樣本號均數標準差95%可信區(qū)間
1488.661.65444.49~532.712498.333.97474.01~522.59
3509.450.96472.96~545.844498.452.63460.76~536.04
5494.929.51473.80~516.006°546.743.23515.78~577.62*
7524.533.60500.45~548.55*8488.341.04458.94~517.66
9485.355.14445.85~524.7510502.648.55467.88~537.32
11495.140.63466.03~524.1712524.737.81497.65~551.75
13512.753.18474.65~550.7514494.837.24468.15~521.45
15493.639.94465.03~522.1716495.329.47474.22~516.38
17491.019.32477.18~504.8218506.553.83468.00~545.00
19487.539.39461.32~517.6820495.932.70472.51~519.29
21504.834.76479.94~529.6622512.244.76483.17~547.23
23496.540.65467.41~525.5924499.837.04473.31~526.29
25505.737.21479.08~532.3226487.734.50463.02~512.38
27501.537.35474.79~528.2128476.129.64454.91~497.29*
29523.251.57486.31~560.0930509.533.61485.45~533.55
31494.228.60473.75~514.6532506.225.29483.10~524.30 
33501.127.88481.15~521.0534520.630.23498.98~542.22 
35492.042.18461.82~522.1836509.619.17495.89~523.31 
37488.642.29458.36~518.8438510.947.55476.88~544.92 
39516.439.96487.81~544.9940518.846.43485.59~552.01 
41495.936.89469.53~522.2742°526.442.78495.80~557.00 
43505.853.84467.30~544.3044503.047.33469.14~536.86 
45504.847.77470.62~538.9846492.429.20471.52~513.28 
47505.538.32478.08~532.9248486.552.98448.59~524.41 
49515.238.69487.51~542.8950487.053.75448.55~525.45 
51503.351.54466.43~540.1752491.058.47449.18~532.82 
53522.365.01475.79~568.8154490.349.92454.58~526.02 
55516.737.26490.05~543.3556489.631.41467.14~512.06 
57490.062.90445.01~534.9958489.230.91467.09~511.31 
59509.140.51480.12~538.0860513.529.18492.62~534.38 
61476.442.06446.32~506.4862511.528.46491.14~531.86 
63480.744.83448.62~512.7864501.429.00480.66~522.14 
65481.150.65444.86~517.3466496.036.53469.87~522.13 
67489.244.20457.58~520.8268494.829.73473.54~516.06 
69497.268.49448.21~546.1970504.135.13478.95~529.25 
71507.934.35483.33~532.4772°465.325.56447.02~483.58* 
73502.645.54470.03~535.1774486.448.51451.70~521.10 
75°526.632.68503.10~550.10*76503.247.18469.45~536.95 
77496.733.45472.77~520.6378504.843.52473.67~535.93 
79490.258.07448.67~531.7380486.626.60467.57~505.63 
81506.128.48485.72~526.4882513.729.28492.75~534.65 
83481.529.78460.19~502.8184491.244.73459.22~523.18 
85515.725.78497.26~534.1486513.964.62467.69~560.11 
87496.423.82479.37~513.4388507.445.14475.10~539.70 
89479.144.15465.52~528.6890498.930.16477.32~520.48 
91503.753.90465.16~542.2492495.930.86473.78~518.02 
93494.658.48452.78~536.4294507.142.4447m.52667788.cn/Article/6.74~537.46 
95488.536.15462.65~514.3596489.168.01440.44~537.76 
97°530.158.72488.09~572.1198518.745.10486.44~550.96 
99507.841.87477.85~537.73100540.655.17465.13~544.07 

已知按正態(tài)分布,理論上有95%的變量值分布在均數加、減1.96倍標準差(樣本均數的標準差稱標準誤)的范圍內,這里也即100個樣本均數中有95個分布在500-1.96(13.60)=473.34至500+1.96(13.60)=526.66的范圍內,F(xiàn)看表6.4,在100個樣本均數中,第6號(546.7)、第72號(465.3)、第97號(530.1)在上述范圍之外,第42號(526.4)及第75號(526.6)就在臨界值附近,其余95個(若將第42及75號計算在內則為97個)樣本均數在此范圍之內,將實際分布與理論分布相對照見下表6.5。100個樣本均數的實際分布與正態(tài)分布的理論基本符合。

...
  • 上一篇文章:
  • 下一篇文章:
  • 關于我們 - 聯(lián)系我們 -版權申明 -誠聘英才 - 網站地圖 - 醫(yī)學論壇 - 醫(yī)學博客 - 網絡課程 - 幫助
    醫(yī)學全在線 版權所有© CopyRight 2006-2046, MED126.COM, All Rights Reserved
    皖ICP備06007007號
    百度大聯(lián)盟認證綠色會員可信網站 中網驗證
  • <small id="wnqo8"><sub id="wnqo8"></sub></small>
    <dl id="wnqo8"><optgroup id="wnqo8"></optgroup></dl>