立即捐款

政經

梁成安:將數據二分化,曲解民調

梁成安:將數據二分化,曲解民調
廣告

廣告

圖:蘋果日報

文:梁成安 (統計學家)

感謝張志剛先生在2014年3月18日於《明報》撰寫的文章。以下是本人對該撰文的回應:

杜威曾說:「人總是將問題兩極化」(Mankind likes to think in terms of extreme opposites. John Dewey)若只傾於思考合格或不合格,是違反統計學原則。用0-100連續分數來評價特首的表現,正正是避免將數據二分化。綜觀而言,平均分47.5分不是很差,可以更差,但也不是好,極其量是勉強合格,分析如下。

這裡一個重要的爭議是如何解讀確切地打50分的人,不多也不少,這些人數佔28%,在問卷所用的措辭是「一半一半」,較為中立,儘管視之為合格,也是「僅僅合格」,市民滿意僅僅合格嗎?其實,這28%對日後特首選舉起了關鍵作用。這也是理解為僅僅合格主要原因。

張志剛正確地指出47.5分是受那9%的受訪者確切的打了0分所影響,但是,未能指出當中有2.7%的受訪者確切的打了100分(不是99)。若沒有這群打100分的人,平均分比47.5更低。只說打0分的而不說打100分的,有欠公允。

張志剛指出極端10%受訪者打了0-9分,使分佈非正常分佈,統計上是「肥尾巴」(Fat tail),這是對的。但他同樣指出「打50分或以上所佔的百分比會減少」的說法是錯誤的。從原始數據顯示確切的打100分(不是99)的有2.7%之多,這也是「肥尾巴」。肥尾巴出現於分數的兩個極端而非一個極端。事實上,這兩群眾的百分比的增減對社會的和諧有直接影響。

文章提到「50分以上的組群,他們相對平和理性」。但是,第一,平和及理性是兩個不同的概念,不能混在一起,所有打分始終是主觀感覺,不能用理性去形容。第二,將50至100分劃成一組,將50分以下劃成另一組,即是將打50分的人等同於打100分的人,打0分的等同於49分的,適合嗎? 第三,打50分的人我認為是平和,但49, 48, …分的就不平和嗎?我認為打0分的人不平和,但打100的人同樣也不平和。第四,也是最致命的,嘗試將所有人分成兩組,一組少於50分,一組50分或者以上,這其實是將0至100分之人士硬性分成兩組的二分化,不但曲解民調,這也不利於建構和諧社會。

最後,希望解讀民調時不要將問題二分化,合格或不合格。

* 原刊於2014年4月15日《成報》

廣告