從部分到整體的有效推論方式——推斷統計

推斷統計學(inferential statistics)是研究如何根據樣本資料推斷總體特徵的方法,是在對樣本資料進行描述的基礎上,對統計總體的未知數量特徵做出概率形式表述的推斷。推斷統計包括總體參數估計和假設檢驗。相比之下,描述統計學(descriptive statistics)研究資料反映客觀現象的特點,並通過圖表形式對樣本資料進行加工處理和顯示,得出規律性數量特徵。

總體(population)是研究物件的整個群體。樣本(sample)是從總體中選取的一部分資料。樣本數量是指有多少個樣本。樣本大小(又稱樣本容量)是指每個樣本包含多少個體。統計量(statistic)指的是關於樣本的測量,而參數(parameter)指的是關於總體的測量。概率樣本的置信區間(confidence interval)是對該樣本的某個總體參數(例如均值)的區間估計,展示的是這個參數的真實值以一定概率落在測量結果周圍的程度。置信區間給出的是被測量參數的測量值的可信程度,即前面所要求的“一定概率”。這個概率即為置信水準,亦稱置信度。置信度b與顯著性水準a之間的關係為b=(1-a)´100%。例如,95%置信度的置信區間意味著,如果你以完全相同的方式用一個新樣本重複研究100次,你可以預期估計值在指定的值範圍內的次數達到95次。以上是相關統計學概念的簡介。下面談一下總體參數估計和假設檢驗。

總體參數估計是指通過樣本對總體特徵進行估計,即如何從局部結果推論總體情況。總體參數估計可分為點估計(point estimate)和區間估計(interval estimate)。點估計是在用樣本統計量估計總體參數時,估計的結果以一個點的數值表示。點估計總是存在誤差的,並且無法指出對總體參數給予正確估計的概率有多大。因此,點估計只能作為一種不精確的大致估計,更好的辦法是對總體參數進行區間估計。區間估計是根據樣本統計量,利用抽樣分佈原理,用概率表示總體參數可能落在某數值區間內的推算方法。在區間估計中,給定置信度,根據估計值確定真實值可能出現的區間範圍,該區間通常以估計值為中心。區間估計的種類有很多,主要包括總體平均值的區間估計、總體百分數的區間估計、標準差和方差的區間估計、相關係數的區間估計等。從構造估計值的方法來看,包括矩法估計、最小二乘法估計、最大似然估計、貝葉斯估計等。區間估計通常需要處理兩個問題:(1)求出參數的估計值;(2)在一定置信度下指出所求估計值的精度。精度用估計值與被估參數之間的接近程度或誤差來度量。例如,由於發動機產品投試樣品的數量通常較少,造成可靠度估計帶有較大的不確定性。使用帶有置信區間或給定置信度(例如90%)的可靠度區間估計方法比使用僅具有50%置信度的可靠度點估計方法更為重要。

在統計學中,通過樣本統計變數得出的差異做出一般性結論,判斷總體參數之間是否存在差異,並且判斷樣本與樣本、樣本與總體的差異是由抽樣誤差(sampling error)引起的還是由本質差別造成的。這種推論過程稱為假設檢驗(hypothesis testing,又稱統計假設檢驗)。抽樣誤差是測量樣本值與真實總體參數值之間的差值,其產生的原因是由於樣本的大小總是小於總體的大小,所以樣本資料無法捕獲一些總體特徵。在假設檢驗中,給定置信度,根據真實值的假設值確定估計值可能出現的區間範圍,該區間通常以假設值為中心。如果計算得到的估計值在此區間範圍內,則接受原假設,否則拒絕原假設。例如,在10個地點進行森林間伐後,樹木的生長速度提高了25%,而在另外10個地點沒有進行森林間伐,要求使用推論統計決定增長率的增加是出於偶然還是真實的。如果假設森林稀疏對樹木生長速率沒有影響,那麼這種假設被稱為零假設。假設檢驗分為參數核對總和非參數檢驗。若進行假設檢驗時總體的分佈形式已知,需要對總體的位置參數進行假設檢驗,稱其為參數假設檢驗。若對總體分佈形式所知甚少,需要對未知分佈函數的形式及其他特徵進行假設檢驗,稱之為非參數假設檢驗。顯著性檢驗是假設檢驗中最常用的一種方法,也是一種最基本的統計推斷形式。其基本原理是先對總體的特徵做出某種假設,然後通過抽樣研究的統計推理,對應該拒絕此假設還是接受做出推斷。常用的假設檢驗方法有Z檢驗、t檢驗、卡方檢驗、F檢驗等。

綜上所述,推斷統計是廣泛用於生物醫學和可靠性工程等概率性(非確定性)分析問題的常用方法,也是學術素養中資料處理方法的重要組成部分。在學術論文中運用推斷統計時,需要注意在“材料與方法”部分對相關概念和假設的應用給出完整嚴謹的論述。

 

X

請訂閱以繼續閱讀

關於科研寫作和學術出版的文章與學術資源,包括:

  • 820 +文章
  • 50+ 免費線上講座
  • 10+ 專家Podcast
  • 10+ 電子書
  • 10+ 檢查清單
  • 50+ 資訊圖
全球科研人調查

您希望抄襲檢測具備哪些功能?(請選擇所有適用選項)