(1)
卡方檢定
數值自由度漸近顯著性 (雙尾)
Pearson卡方 8.463a 20 .988
概似比 9.407 20 .978
線性對線性的關連 .004 1 .948
有效觀察值的個數101
a. 25格 (83.3%) 的預期個數少於 5。 最小的預期個數為 .24。
(2)
卡方檢定
數值自由度漸近顯著性 (雙尾)
Pearson卡方 22.434a15 .097
概似比 31.07915. 009
線性對線性的關連 .005 1 .944
有效觀察值的個數 101
a. 17格 (70.8%) 的預期個數少於 5。 最小的預期個數為 .59。
兩個表都顯示有大半 cells 的 expected counts 小於 5, 甚至有小
於 1 的. 這表示其卡方檢定有些問題. 在現有樣本之下, 改善之道
是合併變數分類.
SPSS 輸出中的 "雙尾" 應是程式設計者基本統計觀念不足產生的
錯誤. 這兩個例子可能是在做列聯表獨立性檢定, 這樣的卡方檢定
看的只是右尾; 不過其對立假說是無方向性的---事實上列聯表獨立
性檢定有多個向度, 因為行列變數都是 "名目的"(nominal, 後面的
報表 SPSS 把它譯為 "名義的"), 並不像數值的變數可以分正負.
"Pearson 卡方" 是基礎統計學教本常見的 "卡方配適度檢定"、"列
聯表卡方檢定" 的卡方; "概似比" 卡方又以 G^2 表示, 是基於
likelihood ratio test 在大樣本次下的檢定統計量.
表1 兩種卡方 p 值都很高(一個 0.988, 一個 0.978), 沒有任何證據
可以棄卻 H0. 也就是說不能否定 "行列變數獨立" 的假說.
表2 的 Pearson 卡方與 G^2 的 p 值有些差異, 如以 0.05 為顯著
水準, 前者 p 值 0.097 表示不能棄卻 H0; 後者 p 值 0.009 表示應
棄卻 H0. 這種兩近似卡方檢定結論不一致的現象, 也暗示了樣本
不夠大, 或說是緣於樣本不夠大.
"線性對線性" 的關聯度檢定, 必須列聯表之行、列變數至少是順
序尺度. 若是名目尺度則不適用. 這裡的這個檢定統計量, 大概是
把行列變數當順序尺度變數, 並按其分類依次給予分數 1, 2, ...,
而後計算相關係數, 並由此得到一個大樣本之下漸近服從一個自
由度的卡方分布的統計量 (Agresti 的類別分析教本以 M^2 表示).
兩個表這個檢定統計量的 p 值都很高 (0.948, 0.944). 可能其行列
變數並非順序尺度, 也可能即使是順序尺度, 即使它們有關聯 (不
獨立), 但卻不是直線的關聯 --- 甚至可說: 完全沒有證據說存在直
線關聯.
(1)
對稱性量數
數值顯著性近似值
以名義量數為主列聯係數 .278 .988
有效觀察值的個數 101
(2)
對稱性量數
數值顯著性近似值
以名義量數為主列聯係數 .426 .097
有效觀察值的個數 101
"列聯係數" 定義應是 P = √[χ^2/(χ^2+n)].
由於列聯係數是根據 Pearson 卡方計算的, 因此其 p 值也與前面
的 Pearson 卡方一致. 表 1 的 p 值顯示完全沒有證據說行列變數
間有關聯; 表2 的 p 值雖較低, 但 0.097 要推翻 "無關聯(獨立)" 的
虛無假說, 一般而言也是不夠的.
雖然報表中的統計量及其 p 值給研究者一些訊息, 但別忘了: 這只
是假設所列卡方統計量可以近似適用卡方分布數值表. 然而, cells
的 expected counts 偏低, 顯不樣本數不夠, 中央極限定理尚難適
用, 卡方統計量也不近似卡方分布. 因此, 適當合併變數之類別再
重新計算, 才是正途.
留言列表