97. 基本概念 拒絕規則 p-value ⺟體比例 t 檢定
統計假設:例⼦三
考慮以下假設:「這個候選⼈有超過 50% 選⺠的⽀持。」
我們需要⼀個預設立場,⽽我們在乎的百分比為 50%,因此我們選擇的
虛無假設為
H0 : p = 0.5。
p 是偏好⽀持該候選⼈的選⺠⺟體比例。
更精確⽽⾔,令 Xi = 1 如果該選⺠ i 偏好⽀持這個候選⼈,否則以 0 表
⽰,i = 1, ..., N,那麼 p =
∑N
i=1 Xi
N
。
那對立假設呢?是
Ha : p 0.5 還是 Ha : p 0.5?
假設檢定 9 / 58 孔令傑(臺⼤資管系)
98. 基本概念 拒絕規則 p-value ⺟體比例 t 檢定
統計假設:例⼦三
對立假設的選擇取決於要進⾏的決策或⾏動。
假設⼀個⼈只有在相信⾃⼰會贏的時候(即 p 0.5)才會參選,那麼
對立假設為
Ha : p 0.5。
假設⼀個⼈傾向參選,並只有在獲勝機率低時才會退出,則對立假設為
Ha : p 0.5。
對立假設是「我們想要(需要)證明的事」。
假設檢定 10 / 58 孔令傑(臺⼤資管系)
128. 基本概念 拒絕規則 p-value ⺟體比例 t 檢定
課程⼤綱
基本概念。
拒絕規則。
p-value。
⺟體比例。
t 檢定。
假設檢定 40 / 58 孔令傑(臺⼤資管系)
129. 基本概念 拒絕規則 p-value ⺟體比例 t 檢定
檢定⺟體比例
在很多情況下,我們需要檢定⺟體比例。
⽣產系統的缺陷率和收益率。
⽀持⼀個候選⼈或政策的⼈⺠比例。
瀏覽產品⾴⾯後真的購買的比例(轉化率)。
如何檢定⺟體比例呢?
假設我們想要檢定男性使⽤者的比例:
讓我們先標記男性使⽤者為 1,非男性使⽤者為 0。
⺟體比例 p =
∑N
i=1 Xi
N
就是個⺟體平均數。
⼀個樣本比例 ˆp =
∑n
i=1 Xi
n
是樣本平均數。
因為⺟體顯然不常態,因此不能⽤ t 檢定。
因為可以由 p 計算 σ 為
√
p(1 − p),我們⽤ z 檢定來檢定⺟體比例。
限制:n ≥ 30,nˆp ≥ 5 及 n(1 − ˆp) ≥ 5。
假設檢定 41 / 58 孔令傑(臺⼤資管系)
130. 基本概念 拒絕規則 p-value ⺟體比例 t 檢定
假設
⺟體比例是 p。
若想知道⺟體比例是否為 p0,雙尾檢定是
H0 : p = p0
Ha : p ̸= p0。
在⼀個單尾檢定中,對立假設可以是
Ha : p p0 或 Ha : p p0。
假設檢定 42 / 58 孔令傑(臺⼤資管系)
131. 基本概念 拒絕規則 p-value ⺟體比例 t 檢定
例⼦
在⼀座⼯廠裡,我們產品的缺陷率似乎太⾼了。理想上,它應該少於
1%,但是有些⼯⼈認為是⾼過 1% 的。
如果缺陷率⾼過 1%,我們就應該修理機器,反之就不要2
。
令 p 為缺陷率,假設為
H0 : p = 0.01
Ha : p 0.01。
2什麼時候使⽤ Ha : p 0.01 呢?
假設檢定 43 / 58 孔令傑(臺⼤資管系)
146. 基本概念 拒絕規則 p-value ⺟體比例 t 檢定
⼩結
為檢定⺟體平均數 µ:
σ2
樣本數
⺟體分佈
常態 非常態
已知
n ≥ 30 z z
n 30 z 無⺟數
未知
n ≥ 30 t 或 z z
n 30 t 無⺟數
更多可以被檢定的⺟體參數:
⺟體比例(z 檢定)、⺟體變異數(χ2
檢定)。
兩⺟體平均數的差異(t 檢定)、兩⺟體變異數的比例(F 檢定)。
假設檢定 58 / 58 孔令傑(臺⼤資管系)
194. Interaction Endogeneity, residuals Logistic regression
Statistics and Data Analysis for Engineers
Part 4: Regression Analysis (2)
Ling-Chieh Kung
Department of Information Management
National Taiwan University
January 14, 2017
Regression Analysis (2) 1 / 38 Ling-Chieh Kung (NTU IM)