# 請統計高手幫忙...萬分感謝!!

To assess the validity of the questionnaire, it was examined by four e-book researchers. We further determined the associations between questionnaire scores and the two global indicator analysis(X的二次方=5148.462, df=990,p=0.000<0.001), the construct validity of the questionnaire was confirmed. Moreover,the internal consistency and reliability were tested by means of the Cronbach's alpha coefficient ranged from 0.86 to 0.91(use-fulness=0.88) Ease of use=0.86,Ease of learning=0.88, Satisfaction=0.87, Functionality=0.91),indicating the questionnaire was accceptable with good internal consistency and reliability.

df是什麼?

p是什麼?

to老怪物,

To assess the validity of the questionnaire, it was examined by four e-book researchers.

為評估問卷的效度, 經由四位電子書研究者檢查過.

We further determined the associations between questionnaire scores and the two global indicator analysis(X的二次方=5148.462, df=990,p=0.000<0.001), the construct validity of the questionnaire was confirmed.

我們進一步探討問卷分數與兩項 global inducator analysis 之間

的關聯, 結果檢定統計量 X^2 = 5148.462, 自由度 df=990, p值

小於 0.001, 因此問卷的建構效度得到驗證.

Moreover,the internal consistency and reliability were tested by means of the Cronbach's alpha coefficient ranged from 0.86 to 0.91(use-fulness=0.88) Ease of use=0.86,Ease of learning=0.88, Satisfaction=0.87, Functionality=0.91),indicating the questionnaire was accceptable with good internal consistency and reliability.

又, 內在一致性及信度利用 Cronbach 的 alpha 係數來檢驗, 結果 alpha

係數值從 0.86 至 0.91 (usefulness=0.88, ease of use=0.86,

ease of learning=0.88, satisfaction=0.87, functionality=0.91),

這些結果顯示問卷的內在一致性及信度是可接受的.

以上是把原文以我的理解用中文寫出來.

不過, 我不了解其中關於 "效度"(validity) 的分析. 其 X^2 統計量究竟

是怎麼算的? 在 test 什麼東西?

一般而言, 統計假說檢定是用於證實有無差異. 因此, 若上述檢定是

要證實其 questionaire scores 與兩項 global indicatior analysis 之

間是存在關聯的, 那麼 p 值小於 0.001 確實顯示有充分證據說它們

之間的關聯是存在的. 然而, 效度不只要的是 "有關聯", 而是要 "高

度直線相關", 至少退而求其次, 是 '高度關聯". (我所知的效度的定

義是用相關係數, 也就是說必須是直線相關.) 文中所述 X^2 檢定的

p 值很低, 顯示 "有關聯" 的證據很強. 但這和 "高相關" 的要求是兩

回事, 也許相關係數不到 0.1, 也可能得到很小的 p 值. 例如簡單相

關係數的檢定, 對應 df=990, 當樣本相關係數 0.1 時,

t = 990*0.1/√(1-0.1^2) = 90.5

其 p 值遠遠低於 0.001 (想一下常態分布在 90 倍標準差之外的機

率是多少? 10的負幾百次方吧!)

又, 信度(reliability) 有好幾種, Cronbach's alpha 就是其中一種指標,

因為用的只是一份資料, 所以又稱 internal consistency (內在一致性).

文中把 "internal consistency" 與 "reliability" 看成並列的兩種東西,

令人不由懷疑作者對此了解多少? 固然 reliability 與 internal consistency

不是相同的東西, 但後者是前者的一種, 兩者並不能並肩而立.

回到所問的, X^2 是什麼? 事實上我不清楚, 不過它可能是 chi-squared,

但具體計算就不知道了! 它應不是列聯表分析中的 χ^2, 倒是有可能是

統計上所謂 "概度比檢定"(likelihood ratio test) 統計量. 事實上應用者

及讀者也不需了解計算細節, 倒是它究竟在檢定什麼東西比較重要. 我

的猜測是如前文說的, 它在檢定 questionaire scores 與所引的兩項

global indicator analysis 之間是否存在關聯.

老是 "超過字數", 真討厭的系統!

基本上上述 X^2 如果是 chi-squared, 用的是大樣本漸近(asympotic)

的理論, 也就是說如果樣本數夠大, X^2 可以認為分布近似於真正的

chi-squared. 而 chi-squared 分布與其 "自由度" 有關, ...

...這 "自由度"

在統計上跟 H0 與全模型 Ha 的參數個數有關. 此處的 X^2 統計量可

能是 "H0: 指標間無(某種)關聯" 的配適度檢定(goodness of fit test)

統計量, 因此自由度就是 n-k, 其中 n 是樣本數, k 是在 H0 之下需要

樣本去估計參數而產生的限制條

其中 n 是樣本數, k 是在 H0 之下需要

樣本去估計參數而產生的限制條件數.

"p 值" 與 "顯著水準" 是用統計方法必須知道的基本概念. 昨天才回

答過一個問題, 現在把相關的部分剪貼過來:

p 值有兩種解釋:

(1) 顯著水準低到什麼值時, 這個結果可以被判定 "有顯著差異"?

(2) 在 null hypothesis H0 成立穿的情況下, 抽樣會得到像目前這

樣的結果, 或更極端的結果的機率是多少?

顯著水準, 是做統計假說檢定時, 在 H0 成立之下, 抽樣結果會判

定 "差異顯著", 也就是判定 "H0 不成立" 的機率上限. 這是一種

錯誤判定, 因此發生的機率不能允許太大, 所以顯著水準一般都

取相當小的值, 例如 0.05.

因此, 若 p值大於顯著水準, 就表示資料不支持判定拒絕 H0, 也

就是說沒有足夠證據說明 H0 是錯的.

修正一項錯誤:

簡單相

關係數的檢定, 對應 df=990, 當樣本相關係數 0.1 時,

t = (√990)*0.1/√(1-0.1^2) = 3.16

雙尾 p 值 0.0015, 踵未小於 0.001, 也是很小.

若 r=0.15, 則 t 值為 4.774, p 值=1.8×10^{-6}, 即 0.0000018.

相關係數 0.15 就 "效度" 的要求來說, 可以說是完全不具效度!

那個X的平方叫 chi-square

df = degree of freedom

p = p-value

由於時間關係，我留待老怪物和Lopez答你～

加油！

