設計者 發問時間: 科學數學 · 7 年前

請問關於spss 卡方分配 圖表解釋?

卡方檢定

數值自由度漸近顯著性 (雙尾)

Pearson卡方 8.463a 20 .988

概似比 9.407 20 .978

線性對線性的關連 .004 1 .948

有效觀察值的個數101

a. 25格 (83.3%) 的預期個數少於 5。 最小的預期個數為 .24。

對稱性量數

數值顯著性近似值

以名義量數為主列聯係數 .278 .988

有效觀察值的個數 101

這是第一張表~請問這圖要怎麼看?

卡方檢定

數值自由度漸近顯著性 (雙尾)

Pearson卡方 22.434a15 .097

概似比 31.07915. 009

線性對線性的關連 .005 1 .944

有效觀察值的個數 101

a. 17格 (70.8%) 的預期個數少於 5。 最小的預期個數為 .59。

對稱性量數

數值顯著性近似值

以名義量數為主列聯係數 .426 .097

有效觀察值的個數 101

請問這第二張圖也怎麼看~上面兩張圖差在哪裡呢?怎麼知道有沒有達標準?

1 個解答

評分
  • 7 年前
    最佳解答

    我沒有 SPSS, 對於問題中的輸出有兩點我不甚理解:

    1. 我不了解其卡方檢定之 "顯著性" 註明是 "雙尾" 的意思是什麼?

    在這樣的問題, 就卡方統計量而言, 應誣都只看右尾.

    2. 我不確定其 "線性對線性" 關聯度檢定採用的確實模型是什麼,

    是對數線性模型的 linear-by-linear model, 還是線性相關係數的

    檢定.

    2013-06-16 10:19:30 補充:

    兩個表都顯示有大半 cells 的 expected counts 小於 5, 甚至有

    小於 1 的. 這表示其卡方檢定有些問題. 在現有樣本之下, 改善

    之道是合併變數分類.

    之所以關心是否 cell's expected counts 在 5 以上或小於 5, 因

    為採用的 "卡方檢定" 是基於大樣本之下, 多項分布可用多變量

    常態分布近似, 因而得到卡方統計量在 H0 之下近似服從卡方

    分布. 而適用的標準是每個 cell 的期望次數至少為 5. 雖然, 數

    值模擬的結論說可以放寬, 但也要求:

    1. 期望次數小於 5 的比例不能太高; 且

    2. 期望次數至少為 1.

    2013-06-16 10:28:17 補充:

    "Pearson 卡方" 是基礎統計學教本常見的 "卡方配適度檢定"

    的卡方; "概似比" 卡方又以 G^2 表示, 是基於 likelihood ratio

    test 在大樣本次下的檢定統計量.

    表1 兩種卡方 p 值都很高, 沒有任何證據可以棄卻 H0.

    表2 的 Pearson 卡方與 G^2 的 p 值有些差異, 如以 0.05 為

    顯著水準, 前者 p 值 0.097 表示不能棄卻 H0; 後者p值0.009

    表示應棄卻 H0. 這種兩近似卡方檢定結論不一致的現象, 也

    暗示了樣本不夠大.

    2013-06-16 10:32:25 補充:

    "Pearson 卡方" 是基礎統計學教本常見的 "列聯表卡方檢定"

    的卡方; "概似比" 卡方又以 G^2 表示, 是基於 likelihood ratio

    test 在大樣本次下的檢定統計量.

    表1 兩種卡方 p 值都很高, 沒有任何證據可以棄卻 H0.

    表2 的 Pearson 卡方與 G^2 的 p 值有些差異, 如以 0.05 為

    顯著水準, 前者 p 值 0.097 表示不能棄卻 H0; 後者p值0.009

    表示應棄卻 H0. 這種兩近似卡方檢定結論不一致的現象, 常

    緣於樣本不夠大.

    2013-06-16 10:39:10 補充:

    不管 SPSS 用哪種模型做 "線性對線性" 的關聯度檢定, 基本上

    都必須列聯表之行、列變數至少是順序尺度. 若是名目尺度則不

    適用. 若兩變數一是名目尺度, 另一是順序尺度, 則有另一種檢定

    統計量, 看來 SPSS 並未計算這種統計量.

    上述 "名目尺度" , 在所列 SPSS 輸出中是稱 "名義量數". 其

    "列聯係數" 定義應是 P = √[χ^2/(χ^2+n)].

    2013-06-18 10:41:52 補充:

    (1)

    卡方檢定

    數值自由度漸近顯著性 (雙尾)

    Pearson卡方 8.463a 20 .988

    概似比 9.407 20 .978

    線性對線性的關連 .004 1 .948

    有效觀察值的個數101

    a. 25格 (83.3%) 的預期個數少於 5。 最小的預期個數為 .24。

    (2)

    卡方檢定

    數值自由度漸近顯著性 (雙尾)

    Pearson卡方 22.434a15 .097

    概似比 31.07915. 009

    線性對線性的關連 .005 1 .944

    有效觀察值的個數 101a. 17格 (70.8%) 的預期個數少於 5。 最小的預期個數為 .59。

    兩個表都顯示有大半 cells 的 expected counts 小於 5, 甚至有小

    於 1 的. 這表示其卡方檢定有些問題. 在現有樣本之下, 改善之道

    是合併變數分類.

    SPSS 輸出中的 "雙尾" 應是程式設計者基本統計觀念不足產生的

    錯誤. 這兩個例子可能是在做列聯表獨立性檢定, 這樣的卡方檢定

    看的只是右尾; 不過其對立假說是無方向性的---事實上列聯表獨立

    性檢定有多個向度, 因為行列變數都是 "名目的"(nominal, 後面的

    報表 SPSS 把它譯為 "名義的"), 並不像數值的變數可以分正負.

    "Pearson 卡方" 是基礎統計學教本常見的 "卡方配適度檢定"、"列

    聯表卡方檢定" 的卡方; "概似比" 卡方又以 G^2 表示, 是基於

    likelihood ratio test 在大樣本次下的檢定統計量.

    表1 兩種卡方 p 值都很高(一個 0.988, 一個 0.978), 沒有任何證據

    可以棄卻 H0. 也就是說不能否定 "行列變數獨立" 的假說.表2 的 Pearson 卡方與 G^2 的 p 值有些差異, 如以 0.05 為顯著

    水準, 前者 p 值 0.097 表示不能棄卻 H0; 後者 p 值 0.009 表示應

    棄卻 H0. 這種兩近似卡方檢定結論不一致的現象, 也暗示了樣本

    不夠大, 或說是緣於樣本不夠大.

    "線性對線性" 的關聯度檢定, 必須列聯表之行、列變數至少是順

    序尺度. 若是名目尺度則不適用. 這裡的這個檢定統計量, 大概是

    把行列變數當順序尺度變數, 並按其分類依次給予分數 1, 2, ...,

    而後計算相關係數, 並由此得到一個大樣本之下漸近服從一個自

    由度的卡方分布的統計量 (Agresti 的類別分析教本以 M^2 表示).

    兩個表這個檢定統計量的 p 值都很高 (0.948, 0.944). 可能其行列

    變數並非順序尺度, 也可能即使是順序尺度, 即使它們有關聯 (不

    獨立), 但卻不是直線的關聯 --- 甚至可說: 完全沒有證據說存在直

    線關聯.

    (1)

    對稱性量數

    數值顯著性近似值

    以名義量數為主列聯係數 .278 .988

    有效觀察值的個數 101

    (2)

    對稱性量數

    數值顯著性近似值

    以名義量數為主列聯係數 .426 .097

    有效觀察值的個數 101

    "列聯係數" 定義應是 P = √[χ^2/(χ^2+n)].

    由於列聯係數是根據 Pearson 卡方計算的, 因此其 p 值也與前面

    的 Pearson 卡方一致. 表 1 的 p 值顯示完全沒有證據說行列變數

    間有關聯; 表2 的 p 值雖較低, 但 0.097 要推翻 "無關聯(獨立)" 的

    虛無假說, 一般而言也是不夠的.

    雖然報表中的統計量及其 p 值給研究者一些訊息, 但別忘了: 這只

    是假設所列卡方統計量可以近似適用卡方分布數值表. 然而, cells

    的 expected counts 偏低, 顯不樣本數不夠, 中央極限定理尚難適

    用, 卡方統計量也不近似卡方分布. 因此, 適當合併變數之類別再

    重新計算, 才是正途.

還有問題?馬上發問,尋求解答。