統計急救箱─單樣本t檢定

更新 發佈閱讀 7 分鐘

如果把前面把Z檢定和標準誤、標準差給搞懂,那麼t檢定的理解其實就滿簡單的了。

實務上來說,用Z檢定的機會其實比t檢定少,這是因為t分數只需要使用樣本標準差就能算出來,而Z分數卻需要仰賴一個我們根本不知道多少的母體標準差。

這篇的目標就是介紹單樣本t檢定的原理,稍微有點長,比較需要耐心。


本篇文章所介紹的t分數,全名為Student't score (有人翻譯為司徒頓t檢定)。一般在社會科學研究當中,沒有特別舉出全名的話,t分數通常就是指Student't score。

之所以會強調這一點,是因為除了經典的Student't test之外,也有其他的t-test存在。



t分數跟Z分數很類似

  首先我們需要介紹一下t分數是什麼東西。

  在先前的文章 (統計急救箱─抽樣分布與標準誤) 當中,提到過抽樣分布會長成什麼樣子,是由兩個數值決定的:第一個是母體平均數(決定位置),第二個是母體標準差(決定寬度)。

  但因為我們不會知道母體標準差是多少,所以就只好用已知的樣本標準差 (就是這次收資料算出來的標準差) 來代替,形成抽樣分布的標準誤 (SE)。這樣一來,我們就可以做像是Z檢定一樣的統計檢定囉~

  這個檢定的名字,就叫做t檢定。也就是說,把Z檢定裡的抽樣分布標準差 (standard deviation of sampling distribution),改成抽樣分布標準誤 (standard error of sampling distribution),就會從Z檢定變成t檢定了


t檢定的原理跟Z檢定是相同的,只是用的是標準誤而不是標準差

t檢定的原理跟Z檢定是相同的,只是用的是標準誤而不是標準差


t分數和Z分數的關鍵差異:自由度

  但這時候可能會有個疑惑...就這麼簡單?直接把母體標準差換成樣本標準差真的不會有什麼問題嗎?

  嗯...原理上來說其實真的就這麼簡單沒錯。但當然把母體標準差直接換成樣本標準差,還是會有點不一樣的。那就是...這樣計算出來的抽樣分布不會是個常態分布,而變成一種叫做t分布的分布

  哇,那這下問題不就大了?前面說的假設檢定都建立在抽樣分布形成的常態分布上,結果現在t檢定卻建立在一個不是常態的分布上,那我們怎麼算機率做檢定?  

  

  沒關係,我們先來看看t分布到底長成什麼樣子再說。

  t分布雖然不是一個常態分布,但其實長得也滿像常態的。更重要的是,t分布的形狀會隨著我們抽樣的樣本大小而改變

  這是什麼意思呢?我們用下面的圖來比較一下。假設下面描繪的都是所謂的「抽樣分布 (sampling distribution)」(想了解抽樣分布是什麼,可以參考統計急救箱─抽樣分布與中央極限定理(一))。

  黑色的線就是標準常態分布 (平均數為0,標準差為1的常態分布),紅色的線段是樣本數很小的時候算出的t分布,藍色的線段樣本數比紅色的多,綠色的線段樣本數又比藍色更多。也就是說,黑色的線就是我們拿來做Z檢定的常態分布曲線,而紅色、藍色、綠色的線則是我們把Z分數改成t分數後得出來的分布曲線(只不過這三條線代表的抽樣樣本數是不一樣的)。

  在這裡我們會發現一件事:樣本數越大的時候,t分數的線會越來越靠近常態分布 (綠色的線很接近黑色的線)。

不同自由度下的t分布

不同自由度下的t分布


  有趣的是,當樣本數大到某個程度以後,t分布的線段幾乎就不會再隨著樣本數增加而改變了。這個時候的t分布,長得跟常態分布已經幾乎是一模一樣。

  下圖中我們又再次畫了不同樣本數所得出的抽樣分布曲線。可以發現幾乎分不出這些t分布的線段 (綠色、藍色、紅色) 和常態分布曲線的差異了。

自由度夠大的t分數跟常態分布差不多了

自由度夠大的t分數跟常態分布差不多了


到了這個時候,使用樣本標準差而不是母體標準差來計算抽樣分布的標準誤,感覺就沒什麼大問題了吧?因為當樣本數大到某個地步之後,所得到的t分數分布跟常態分布幾乎沒有差,那接下來的事情也就跟Z檢定差不多了。至於這個樣本數到底多大才行?普遍常用的標準是超過30就可以了 (Field, 2017)。


  雖然上面都是說隨著抽樣的樣本數變大 (想像成從袋子中抽出的球數目越多),t分布會越加趨近於常態。不過在統計上不會說樣本數,而是有一個特殊的名詞叫做「自由度 (degree of freedom, df)」來表達t分布樣貌的改變(所以可以看到上面的圖,右上角寫的都是df而不是N,代表這是說自由度的意思)。

  為什麼要這麼麻煩,弄一個新名詞出來?這是因為自由度才是真正決定t分布樣子的參數,只不過這個自由度跟樣本數有關,所以上面為了解釋上的方便才會先用樣本數代替。在不同的情況下,自由度跟樣本數之間的關係會有變化,所以使用樣本數來表達t分布的樣貌不如使用自由度來的精確。也因為這個原因,在報告t檢定結果時一定會一起報告自由度的

  雖然我會建議還是要知道自由度怎麼算比較好,但對於初學者來說也不用太執著這個問題,可以先看統計軟體給你的數字就行了。



單樣本t檢定的運作原理(跟Z檢定是一樣的)

  上面花了大量篇幅指出t分布和Z分布的相似與相異處。不過如果要給個不精確的超級懶人包的話:

在樣本數夠大的時候t分布可以直接被當成Z分布,也因此可以當成抽樣分布來看待。

所以在實務上,t檢定的原理幾乎就跟Z檢定一樣了,這裡就只快速講一下基本邏輯。


  首先,依循Z檢定的邏輯,我們要透過抽樣分布 (sampling distribution) 來做假設檢驗──「若母體平均數為mu,我們現在觀察到的樣本平均數有多大的機率會發生?」假如機率很小 (小於5%機會),我們就可以傾向說母體平均數可能不是mu。

又是這張圖,只不過這次我們要用t分布來當作抽樣分布了 [*1]

又是這張圖,只不過這次我們要用t分布來當作抽樣分布了 [*1]


  在統計急救箱─常態Z分數與Z檢定中,我們以平均數為中心,分別加上或減去一個標準差找出兩個臨界值,畫出了95%的區間。如果觀察值落於這個區間之外,就代表當母體平均數為mu時,看到當前結果的機率小於5%,所以我們拒絕虛無假設 (也就是認為母體平均比較有可能不是mu)。而在t檢定中,我們用同樣的方法找出臨界值,只是把標準差換成標準誤而已。

在Z檢定中我們找臨界值是使用抽樣分布的標準差,而在t檢定中則是用標準誤

在Z檢定中我們找臨界值是使用抽樣分布的標準差,而在t檢定中則是用標準誤


  現在有了臨界值後,唯一剩下需要知道的就是這次抽樣平均數落在這個分布圖上面的哪個點了。計算方法跟Z分數差不多,只是把抽樣分布的標準差改成標準誤就行了。

計算本次抽樣平均數在抽樣分布中的t分數

計算本次抽樣平均數在抽樣分布中的t分數


以上就是t分數和t檢定的基本運作方式囉~

t分數在實務上很好用的,熟悉原理對於後續進階的統計檢定會很有幫助喔。




前一篇說專案快上軌道了,結果...

總之人果然不能亂說話,再不更新我自己都以為要棄坑了。

現在學會單樣本的t檢定了,下一篇就來講講一個常見的應用──相關係數的顯著性檢定吧。

去年開始這個寫作計畫的時候,原本預計一年後至少寫到ANOVA的啊...orz




備註:

[*1] 雖然我之前都說這個常態分布圖的縱軸是機率,但其實並不完全正確。如果仔細瞧瞧縱軸會發現這個常態分布曲線的頂點超過1,但難道有機率可以大於1的嗎?嗯...並不是這樣的。這種圖形在統計上叫做機率密度函數圖 (probability density function, pdf),它的縱軸是有可能大於1沒錯,但把縱軸當成機率來看在某種意義上也沒錯。總之...如果真的想知道的話,要先學會積分才可以,所以這裡就不多說了。不過統計急救箱─常態分布與機率的最後其實有稍微提到一些相關概念。


參考文獻

其實講出建議t檢定樣本數建議超過30的教科書到處都是,這裡只是舉出其中一本而已。

Field, A. (2017). Discovering statistics using IBM SPSS statistics (5th ed.). Sage.


致謝

本文所用圖片當中的素材來自於https://www.flaticon.com,由juicy_fish創作。


留言
avatar-img
統計急救箱的沙龍
78會員
32內容數
大學念文組,碩士班的報告突然要用統計了怎麼辦?沒學過統計怎麼寫量化學位論文?跟著統計書操作都沒問題,但報表都不知道在講什麼,也不知道做的分析到底對不對?作者在應用統計的路上跌跌撞撞也差不多十年了,希望有些心得可以幫助到有這些困擾的你。
2024/12/29
  上回講了獨立樣本t test的運作原理,不過實際的計算上我們還是叫統計軟體跑。對使用者來說更重要的事情反而是──什麼時候我們該使用獨立樣本t test,以及在什麼條件下可以使用獨立樣本t test?
Thumbnail
2024/12/29
  上回講了獨立樣本t test的運作原理,不過實際的計算上我們還是叫統計軟體跑。對使用者來說更重要的事情反而是──什麼時候我們該使用獨立樣本t test,以及在什麼條件下可以使用獨立樣本t test?
Thumbnail
2024/12/15
 在實務上,t檢定最常被拿來使用的時機是檢驗兩個群體的(母體)平均數是不是相同。
Thumbnail
2024/12/15
 在實務上,t檢定最常被拿來使用的時機是檢驗兩個群體的(母體)平均數是不是相同。
Thumbnail
2024/10/20
既然現在講完t檢定的基礎了,正好是時候來談談單樣本t檢定的重要用途之一:檢定相關係數的顯著性。
Thumbnail
2024/10/20
既然現在講完t檢定的基礎了,正好是時候來談談單樣本t檢定的重要用途之一:檢定相關係數的顯著性。
Thumbnail
看更多
你可能也想看
Thumbnail
當我們要確定問卷量表在不同群體(例如:男生和女生)的適用和一致性時,我們就使用多群組測量衡等性檢驗在不同群體,因素和觀察變項之間的關聯是一致。則代表之後統計結果是可信的,反映出真實結果,並非只是量表誤差造成的。
Thumbnail
當我們要確定問卷量表在不同群體(例如:男生和女生)的適用和一致性時,我們就使用多群組測量衡等性檢驗在不同群體,因素和觀察變項之間的關聯是一致。則代表之後統計結果是可信的,反映出真實結果,並非只是量表誤差造成的。
Thumbnail
本文分析導演巴里・柯斯基(Barrie Kosky)如何運用極簡的舞臺配置,將布萊希特(Bertolt Brecht)的「疏離效果」轉化為視覺奇觀與黑色幽默,探討《三便士歌劇》在當代劇場中的新詮釋,並藉由舞臺、燈光、服裝、音樂等多方面,分析該作如何在保留批判核心的同時,觸及觀眾的觀看位置與人性幽微。
Thumbnail
本文分析導演巴里・柯斯基(Barrie Kosky)如何運用極簡的舞臺配置,將布萊希特(Bertolt Brecht)的「疏離效果」轉化為視覺奇觀與黑色幽默,探討《三便士歌劇》在當代劇場中的新詮釋,並藉由舞臺、燈光、服裝、音樂等多方面,分析該作如何在保留批判核心的同時,觸及觀眾的觀看位置與人性幽微。
Thumbnail
  前面說明了所謂「假設檢定」的邏輯,也就是推論統計的基礎。但前面都還只是概念的階段,目前沒有真正進行任何的操作──還沒有提到推論統計的技術。   這篇其實有點像是一個過渡,是將前面的概念銜接到下一篇t分數之間的過程,也可以說是稍微解釋一下t檢定怎麼發展出來的。
Thumbnail
  前面說明了所謂「假設檢定」的邏輯,也就是推論統計的基礎。但前面都還只是概念的階段,目前沒有真正進行任何的操作──還沒有提到推論統計的技術。   這篇其實有點像是一個過渡,是將前面的概念銜接到下一篇t分數之間的過程,也可以說是稍微解釋一下t檢定怎麼發展出來的。
Thumbnail
在知道平均數與標準差之後,就可以進一步了解什麼是所謂的「標準分數」了。 標準分數的重要用途是可以幫助我們比較不同單位、不同分散程度的數值。 以概念來說,跟百分等級(PR)有點類似的味道吧。 標準分數在後續的統計當中也很常會出現的。
Thumbnail
在知道平均數與標準差之後,就可以進一步了解什麼是所謂的「標準分數」了。 標準分數的重要用途是可以幫助我們比較不同單位、不同分散程度的數值。 以概念來說,跟百分等級(PR)有點類似的味道吧。 標準分數在後續的統計當中也很常會出現的。
Thumbnail
今天來聊點較無聊, 不用說你也都會, 但不說也不會注意到的細節。這樣的內容較生硬, 在生活中也較少用到, 但在考試時不小心寫錯絕對會被撇掉, 在跟數學家溝通時不小心誤用, 對方絕對會跳針, 跳針, 再跳針。
Thumbnail
今天來聊點較無聊, 不用說你也都會, 但不說也不會注意到的細節。這樣的內容較生硬, 在生活中也較少用到, 但在考試時不小心寫錯絕對會被撇掉, 在跟數學家溝通時不小心誤用, 對方絕對會跳針, 跳針, 再跳針。
Thumbnail
背景:從冷門配角到市場主線,算力與電力被重新定價   小P從2008進入股市,每一個時期的投資亮點都不同,記得2009蘋果手機剛上市,當時蘋果只要在媒體上提到哪一間供應鏈,隔天股價就有驚人的表現,當時光學鏡頭非常熱門,因為手機第一次搭上鏡頭可以拍照,也造就傳統相機廠的殞落,如今手機已經全面普及,題
Thumbnail
背景:從冷門配角到市場主線,算力與電力被重新定價   小P從2008進入股市,每一個時期的投資亮點都不同,記得2009蘋果手機剛上市,當時蘋果只要在媒體上提到哪一間供應鏈,隔天股價就有驚人的表現,當時光學鏡頭非常熱門,因為手機第一次搭上鏡頭可以拍照,也造就傳統相機廠的殞落,如今手機已經全面普及,題
Thumbnail
如果看過上一篇還不太確定共變數要怎麼計算,這篇會用圖像的方式來進行解釋,最後也會提及共變數的小缺點。
Thumbnail
如果看過上一篇還不太確定共變數要怎麼計算,這篇會用圖像的方式來進行解釋,最後也會提及共變數的小缺點。
Thumbnail
前面兩篇會刻意提到共變數,除了因為共變數在多變量統計裡面非常重要之外,最主要的原因其實是為了解釋皮爾森相關係數而做鋪陳。 相關係數的種類也相當的繁多,這裡介紹的皮爾森相關大概是最常看到的一種啦~
Thumbnail
前面兩篇會刻意提到共變數,除了因為共變數在多變量統計裡面非常重要之外,最主要的原因其實是為了解釋皮爾森相關係數而做鋪陳。 相關係數的種類也相當的繁多,這裡介紹的皮爾森相關大概是最常看到的一種啦~
Thumbnail
這是一場修復文化與重建精神的儀式,觀眾不需要完全看懂《遊林驚夢:巧遇Hagay》,但你能感受心與土地團聚的渴望,也不急著在此處釐清或定義什麼,但你的在場感受,就是一條線索,關於如何找著自己的路徑、自己的聲音。
Thumbnail
這是一場修復文化與重建精神的儀式,觀眾不需要完全看懂《遊林驚夢:巧遇Hagay》,但你能感受心與土地團聚的渴望,也不急著在此處釐清或定義什麼,但你的在場感受,就是一條線索,關於如何找著自己的路徑、自己的聲音。
Thumbnail
《轉轉生》(Re:INCARNATION)為奈及利亞編舞家庫德斯.奧尼奎庫與 Q 舞團創作的當代舞蹈作品,結合拉各斯街頭節奏、Afrobeat/Afrobeats、以及約魯巴宇宙觀的非線性時間,建構出關於輪迴的「誕生—死亡—重生」儀式結構。本文將從約魯巴哲學概念出發,解析其去殖民的身體政治。
Thumbnail
《轉轉生》(Re:INCARNATION)為奈及利亞編舞家庫德斯.奧尼奎庫與 Q 舞團創作的當代舞蹈作品,結合拉各斯街頭節奏、Afrobeat/Afrobeats、以及約魯巴宇宙觀的非線性時間,建構出關於輪迴的「誕生—死亡—重生」儀式結構。本文將從約魯巴哲學概念出發,解析其去殖民的身體政治。
Thumbnail
在前面的文章裡, 我們談了很多機率的概念, 今天我們來聊聊統計學裡最基礎的研究方法: 迴歸分析。
Thumbnail
在前面的文章裡, 我們談了很多機率的概念, 今天我們來聊聊統計學裡最基礎的研究方法: 迴歸分析。
Thumbnail
變異數和共變數分析通常有一些統計的前提假設。如果在進行這些分析時,假設沒有達到滿足,結果將有所偏誤,更可能被審稿者或口委批評。本文首先介紹如何檢測這些假設,然後提出假設不過的解決方法,並附上相關文獻佐證。
Thumbnail
變異數和共變數分析通常有一些統計的前提假設。如果在進行這些分析時,假設沒有達到滿足,結果將有所偏誤,更可能被審稿者或口委批評。本文首先介紹如何檢測這些假設,然後提出假設不過的解決方法,並附上相關文獻佐證。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News