統計中位數 真實上限/下限 問題
統計中位數 真實上限/下限 問題
想請問為什麼真實上下限是往外延伸0.5?有什麼公式推導嗎? 為什麼組距w是真實的上下限相減? 不能用 呈現的上下限嗎?
4 個解答
- 8 年前
老怪物~~好厲害阿! 謝謝您的巨細靡遺的解釋! 最佳解答!
2013-01-29 19:39:00 補充:
疑~怎麼不能將你選為最佳解答呢? 是因為在意見欄嗎?
2013-01-29 19:45:01 補充:
對對!我就是不了解為啥:年齡 "5-9" 確實代表 (如果年齡的計算無限精確) 4.5-9.5.
是因為四捨五入嗎? 5-9包含4.5-9.5的數嗎?
- 老怪物Lv 78 年前
看不懂問題 "為什麼真實上下限是往外延伸0.5" 是在問什麼;
更不懂這和 "中位數" 是什麼關係?
2013-01-28 10:00:33 補充:
早期---大約70年前吧--- "次數分配表" 的組限寫法是例如:
0-1000, 1000-2000, 2000-3000 之類的. 而這種組限也有表示成
0-999, 1000-1999, 2000-2999,... 它們的意思都是
"0以上,未滿1000"; "1000以上,未滿2000"; "2000以上,未滿3000".
2013-01-28 10:00:51 補充:
其中第2種表示法 "上限" 的精確度可能超過原數據的精確度,
因為 "999" 代表的不是 "999" 表面意義, 而是 "未滿1000".
計量少了 0.5 歲.
2013-01-28 10:01:14 補充:
不過, 後來---大約40年前---的教本教的建立次數分配表, 卻是
(1) 原資料有一定的精確度, 例如到整數.
(2) 組限是依原資料精確度表示的.
例如 0-4, 5-9, 10-14 等, 組限的意義就是其表面意義. 也就是
說: "0-4" 代表的就是 0,1,2,3,4 五個數值; 5-9 代表的是 5,6,
7,8,9 五個數值. 因此, "0-4" 這一組的 "組中點" 是 2, "5-9"
這一組的組中點是 7, 兩組間的差距是 5.
2013-01-28 10:01:44 補充:
事實上, 原本 "次數分配" 考慮的是 "連續型" 數值資料的次數分
配 (次數分布), 而現在教本上教的可以說是 "離散型" 數值資料
的次數分配, 並且合併數個值為一組. 而一些基於分組資料的圖示
及計算方法, 其實都是把 "次數分配" 看成是連續型資料的.
2013-01-28 10:02:46 補充:
因此,
在涉及計算時, 必須把它 "連續化", 也就是說: "0-4" 代表的不
是 0,1,2,3,4 五個數字, 而是 "-0.5~0.5", "0.5~1.5",...,
"3.5~4.5" 五個區間連在一起成一個大的區間 "-0.5~4.5". 同
樣的, "5-9" 不只是 5,6,7,8,9 五個數字, 而是 "4.5~9.5" 這
樣的一個區間.
2013-01-28 10:03:03 補充:
即使原資料根本就是非負整數, 如年齡、一個家庭
的子女數等, 當資料分組後, 根據分組資料做計算時也必須如此看
待才不會弄錯.
2013-01-28 10:03:45 補充:
其實, 外文教本上的次數分配做法未必全然適用於一切. 以 "年齡"
而言, 外文教本上的 "0-4" 代表的可能確實是 0,1,2,3,4 五個年
齡; 但以台灣的習慣而言, 最常用於統計的是 "足歲". 因此, 在
台灣的統計資料, 年齡分組 0-4, 5-9, 10-14 等代表的依次是:
"未滿5歲", "滿5歲,未滿10歲", "滿10歲,未滿15歲".
2013-01-28 10:04:05 補充:
因此, 若依外文教本, 以及譯自或抄自外文教本的中文教本方法,
將使 "平均年齡" 等統計量少了 0.5 歲.
2013-01-28 10:15:32 補充:
之所以說:
以 "年齡" 而言, 外文教本上的 "0-4" 代表的可能確實是
0,1,2,3,4 五個年齡
是因他們可能習慣用 "nearest year" 來表示年齡. 所以表現
出來的年齡其實等於是 "小數以下四捨五入" 的結果. 因此,
如年齡 "5-9" 確實代表 (如果年齡的計算無限精確) 4.5-9.5.
2013-01-31 16:48:07 補充:
如前面說的, 如果是台灣的數據, 套用教本上的做法其實是錯的,
因為台灣的統計習慣是用 "足歲".
如果是美國的統計資料, 他們習慣用 "nearest year", 相當於是四
捨五入的歲數. 所以 "5-9" 中 "5歲" 代表的其實是 "4歲半-5歲半";
"6歲" 代表的其實是 "5歲半-6歲半", 以此類推. 於是 "5-9歲" 其實
是 "4歲半-9歲半".