平均數及變異數的抽樣分配(Distribution of Mean and Variance)

更新 發佈閱讀 4 分鐘
vocus|新世代的創作平台

平均數及變異數是兩個很常見也熱門的統計量,平均數被用來描述分配的位置,而變異數則是一個用來衡量分配之分散程度的指標。

一般來說,我們做資料分析時能夠用手上的資料來計算樣本平均數及樣本變異數,再用這些統計量進一步估計母體參數。而我們透過計算得出的樣本平均數及樣本變異數事實上是隨機變數,換句話說,這些樣本平均數及樣本變異數是服從某個機率分配的,它並不是一個固定的數字。

為什麼這些估計值會是隨機變數呢?

舉個例子,假設我們今天想要得知成大男學生的平均身高及身高的變異數,實際上我們很難(像是可能有些學生根本不來學校)把每一個學生的身高都記錄起來,所以進行抽樣是比較合適的做法。

首先,隨機抽取100個成大男學生的身高並計算其樣本平均及樣本變異數,假設我們手上就有一筆樣本平均及樣本變異數的資料了,我們可以用這個統計量去估計全成大男學生的身高,但樣本平均及樣本變異數並不是一個固定的數字,若我們重新做一次抽樣,抽到另100位成大男學生,這些統計量(樣本平均及變異)也會隨之改變。

因此,這些統計量(樣本平均及樣本變異數)是隨機變數,他們不是固定的數字而是 屬於某個機率分配

Julia程式碼

using Random, Distributions, Plots; pyplot()
Random.seed!(0)
# 假設母體分配為exponetial distribution
lambda = 1/4.5
expDist = Exponential(1/lambda)
# n為每一次抽樣的樣本大小
# N為抽樣次數
n, N = 10, 10^6
means = Array{Float64}(undef, N)
variances = Array{Float64}(undef, N)
# 開始進行模擬抽樣,重複N次
for i in 1:N
# 隨機(模擬)抽取樣本資料
data = rand(expDist,n)
# 計算樣本平均及變異數
means[i] = mean(data)
variances[i] = var(data)
end
# 理論的平均和抽樣得出的樣本平均
println("Actual mean: ",mean(expDist),
"\nMean of sample means: ",mean(means))
println("Actual variance: ",var(expDist),
"\nMean of sample variances: ",mean(variances))
# 用直方圖表示其分配
stephist(means, bins=200, c=:blue, normed=true,
label="Histogram of Sample Means")
stephist!(variances, bins=600, c=:red, normed=true,
label="Histogram of Sample Variances", xlims=(0,40), ylims=(0,0.4),
xlabel = "Statistic value", ylabel = "Density")
vocus|新世代的創作平台

Originally published at https://www.juliansweb.com on August 6, 2020.

留言
avatar-img
詹永裕的沙龍
6會員
25內容數
詹永裕的沙龍的其他內容
2020/12/09
Almost every Uyghur has to experience the camps, which China’s government calls “vocational education and training centers.
Thumbnail
2020/12/09
Almost every Uyghur has to experience the camps, which China’s government calls “vocational education and training centers.
Thumbnail
2020/11/15
Flow is a state in which a person performing some activity is fully immersed in a feeling of energized focus, enjoyment, and lost a sense of time.
Thumbnail
2020/11/15
Flow is a state in which a person performing some activity is fully immersed in a feeling of energized focus, enjoyment, and lost a sense of time.
Thumbnail
2020/11/05
Only a “good leader” can help teams become better, promote group operations, and boost organizations’ performance.
Thumbnail
2020/11/05
Only a “good leader” can help teams become better, promote group operations, and boost organizations’ performance.
Thumbnail
看更多
你可能也想看
Thumbnail
別讓統計數字騙了你(How to Lie wish Statistics) 有內建偏差的樣本 抽樣的樣本不足以代表全體,有代表性的樣本,這是指把各種偏差來源都排除的樣本。譬如在街頭或是火車站進行隨機的訪問結果,樣本中會明顯少了總是開車出門的樣本。 受訪者想要給一個會讓訪問員喜歡的答案,在
Thumbnail
別讓統計數字騙了你(How to Lie wish Statistics) 有內建偏差的樣本 抽樣的樣本不足以代表全體,有代表性的樣本,這是指把各種偏差來源都排除的樣本。譬如在街頭或是火車站進行隨機的訪問結果,樣本中會明顯少了總是開車出門的樣本。 受訪者想要給一個會讓訪問員喜歡的答案,在
Thumbnail
假設你有一串時間數列資料,資料時間長度可以是Tick、分鐘K,也可以是日K的等級,請問有甚麼方法可以評估是否為盤整盤 ?
Thumbnail
假設你有一串時間數列資料,資料時間長度可以是Tick、分鐘K,也可以是日K的等級,請問有甚麼方法可以評估是否為盤整盤 ?
Thumbnail
本文分析導演巴里・柯斯基(Barrie Kosky)如何運用極簡的舞臺配置,將布萊希特(Bertolt Brecht)的「疏離效果」轉化為視覺奇觀與黑色幽默,探討《三便士歌劇》在當代劇場中的新詮釋,並藉由舞臺、燈光、服裝、音樂等多方面,分析該作如何在保留批判核心的同時,觸及觀眾的觀看位置與人性幽微。
Thumbnail
本文分析導演巴里・柯斯基(Barrie Kosky)如何運用極簡的舞臺配置,將布萊希特(Bertolt Brecht)的「疏離效果」轉化為視覺奇觀與黑色幽默,探討《三便士歌劇》在當代劇場中的新詮釋,並藉由舞臺、燈光、服裝、音樂等多方面,分析該作如何在保留批判核心的同時,觸及觀眾的觀看位置與人性幽微。
Thumbnail
承續前篇內容,另外使用第二種隨機性檢定方式,來判斷價格是否處於盤整盤,假若為盤整盤,價格應集中在均線位置附近或是前後相鄰的數值差異很小,數據計算方法如下
Thumbnail
承續前篇內容,另外使用第二種隨機性檢定方式,來判斷價格是否處於盤整盤,假若為盤整盤,價格應集中在均線位置附近或是前後相鄰的數值差異很小,數據計算方法如下
Thumbnail
這是一場修復文化與重建精神的儀式,觀眾不需要完全看懂《遊林驚夢:巧遇Hagay》,但你能感受心與土地團聚的渴望,也不急著在此處釐清或定義什麼,但你的在場感受,就是一條線索,關於如何找著自己的路徑、自己的聲音。
Thumbnail
這是一場修復文化與重建精神的儀式,觀眾不需要完全看懂《遊林驚夢:巧遇Hagay》,但你能感受心與土地團聚的渴望,也不急著在此處釐清或定義什麼,但你的在場感受,就是一條線索,關於如何找著自己的路徑、自己的聲音。
Thumbnail
接續第二章內容,本章主要說明雙層次之隨機截距模型的公式和SPSS操作,我們先從公式開始,然後在教學SPSS視窗和語法操作,相信看完後,讀者就會了解雙層次之隨機截距斜率模型概念和操作。
Thumbnail
接續第二章內容,本章主要說明雙層次之隨機截距模型的公式和SPSS操作,我們先從公式開始,然後在教學SPSS視窗和語法操作,相信看完後,讀者就會了解雙層次之隨機截距斜率模型概念和操作。
Thumbnail
「共變異數分析 (ANCOVA)」程序會比較一個連續應變數在兩個以上因素變數之間的平均數,並判定共變量的效應以及共變量與因素之間的交互作用。可以在控制共變數分析,可以調查因素之間的交互作用、以及主要效果。ANCOVA通常用於研究中,研究者希望控制控制變項探的情況下,檢驗一個或多個自變量對依變項。
Thumbnail
「共變異數分析 (ANCOVA)」程序會比較一個連續應變數在兩個以上因素變數之間的平均數,並判定共變量的效應以及共變量與因素之間的交互作用。可以在控制共變數分析,可以調查因素之間的交互作用、以及主要效果。ANCOVA通常用於研究中,研究者希望控制控制變項探的情況下,檢驗一個或多個自變量對依變項。
Thumbnail
背景:從冷門配角到市場主線,算力與電力被重新定價   小P從2008進入股市,每一個時期的投資亮點都不同,記得2009蘋果手機剛上市,當時蘋果只要在媒體上提到哪一間供應鏈,隔天股價就有驚人的表現,當時光學鏡頭非常熱門,因為手機第一次搭上鏡頭可以拍照,也造就傳統相機廠的殞落,如今手機已經全面普及,題
Thumbnail
背景:從冷門配角到市場主線,算力與電力被重新定價   小P從2008進入股市,每一個時期的投資亮點都不同,記得2009蘋果手機剛上市,當時蘋果只要在媒體上提到哪一間供應鏈,隔天股價就有驚人的表現,當時光學鏡頭非常熱門,因為手機第一次搭上鏡頭可以拍照,也造就傳統相機廠的殞落,如今手機已經全面普及,題
Thumbnail
  雖然平均數可以拿來代表一群數值,但一整群數字之中還有另一個很重要的資訊,那就是這群數字有多分散。而變異數 (variance) 或標準差 (standard deviation,簡寫為SD) 就是在描述一群數字的分散程度。
Thumbnail
  雖然平均數可以拿來代表一群數值,但一整群數字之中還有另一個很重要的資訊,那就是這群數字有多分散。而變異數 (variance) 或標準差 (standard deviation,簡寫為SD) 就是在描述一群數字的分散程度。
Thumbnail
點估計(point estimation)是指用樣本資料來估計母體參數,使用一個點的數值表示其估計值,因此稱為點估計。事實上我們相當常見的樣本平均數或樣本變異數就是點估計,我們是使用樣本資料計算出一個數值,然後再用這個點的數值去估計母體的參數。
Thumbnail
點估計(point estimation)是指用樣本資料來估計母體參數,使用一個點的數值表示其估計值,因此稱為點估計。事實上我們相當常見的樣本平均數或樣本變異數就是點估計,我們是使用樣本資料計算出一個數值,然後再用這個點的數值去估計母體的參數。
Thumbnail
5 月將於臺北表演藝術中心映演的「2026 北藝嚴選」《海妲・蓋柏樂》,由臺灣劇團「晃晃跨幅町」製作,本文將以從舞台符號、聲音與表演調度切入,討論海妲・蓋柏樂在父權社會結構下的困境,並結合榮格心理學與馮.法蘭茲對「阿尼姆斯」與「永恆少年」原型的分析,理解女人何以走向精神性的操控、毀滅與死亡。
Thumbnail
5 月將於臺北表演藝術中心映演的「2026 北藝嚴選」《海妲・蓋柏樂》,由臺灣劇團「晃晃跨幅町」製作,本文將以從舞台符號、聲音與表演調度切入,討論海妲・蓋柏樂在父權社會結構下的困境,並結合榮格心理學與馮.法蘭茲對「阿尼姆斯」與「永恆少年」原型的分析,理解女人何以走向精神性的操控、毀滅與死亡。
Thumbnail
要觀察一個數值的集合有很多方法,透過這些方法得出數值集合的某些特徵,可以讓我們除了「感覺」外,能有更「理性客觀」的方式來理解這個數值集合的特徵。 眾數:一個集合中出現最多次的那個元素,以此作為一個集合的代表性特徵算是很直覺的作法。但缺點是,以眾數作為一個集合的標籤,我們無法透過眾數得知
Thumbnail
要觀察一個數值的集合有很多方法,透過這些方法得出數值集合的某些特徵,可以讓我們除了「感覺」外,能有更「理性客觀」的方式來理解這個數值集合的特徵。 眾數:一個集合中出現最多次的那個元素,以此作為一個集合的代表性特徵算是很直覺的作法。但缺點是,以眾數作為一個集合的標籤,我們無法透過眾數得知
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News