立即捐款

區群謬誤

區群謬誤

選舉過後,出現各式各樣的選民數據分析。我發現不少都犯上區群謬誤的問題。大家知道我是地理人,會比較關心這一點,這兒想特別和各位分享這個很重要的地理概念。我們先看看下面兩句說話:

(1) 多人鍾意食雪糕的屋苑通常都多人鍾意打GTA
(2) 鍾意食雪糕的人通常都鍾意打GTA

區群謬誤的意思,是誤以為證明了 (1) ,便等於證明了 (2) 。

現實中,兩件事可以完全沒有關係的。或者鍾意食雪糕和鍾意打GTA的通常都是年輕人,於是各屋苑年輕人的多少會影響到屋苑內鍾意食雪糕和鍾意打GTA的人數,從而在統計上帶來 (1) 的關係。但就這些年輕人本身,可以是有些鍾意食雪糕,有些鍾意打GTA,但不是同一班人;甚至,就算鍾意食雪糕的人特別唔鍾意打GTA,也不一定會影響到 (1) 的出現。

要證明 (2) ,你要做個人層面的調查,不能只用屋苑層面的數據。

明白到這一點,就可以見到這兩天不少「選民研究」的脆弱。拿著整個選區的人口特質和投票取向,是不能直接預測個人的投票行為的。

慢著!我想一定會有人問,喂你梁啟智之前做過好多選舉的社會經濟特質分析,點解又得?兩點回答。一、我做這些分析之前都會基於一些現存個人層面的分析,例如現有的大學票站調查已清楚確立收入和投票取向有關,那這種分析我會做,但沒有這些基礎的分析我就不會做。二、一般我只會基於這些分析去做相同尺度的建議,例如我會叫候選人多去某些類型的選區拉票,但也是僅此而已。

回到上面的例子,如果 (1) 成立的話,GTA 遊戲公司去多人食雪糕的屋苑做宣傳還有點道理,如果把遊戲宣傳廣告放在隨街買得到的雪糕的杯蓋入面就有可能搞錯宣傳對象了。