立即捐款

『歌手黎明』前的黑暗

那個會把『黎明前的黑暗』中的「黎明」誤解作「歌手黎明」?除了捉狹鬼外,原來還有網上《明報》!

當然,這是人工智能軟件的錯,只要在文章中看見在關鍵字庫中的詞,便自動加上超連結。就這樣,所有「黎明」都被連結至「歌手黎明」。

上週六,有關深灣軒的新聞,全部受訪者都沒有超連結,但頭一句『一手貨尾盤減價戰似進入黎明前的黑暗。』的「黎明」便連結了「歌手黎明」,這是全篇唯一的超連結。

上週五,張文光的一篇文章為例,全文提過了毛澤東、劉少奇、文天祥等歷史人物,但全篇亦只有一個超連結,就是最後一句『...中國走過文革40年,換來法治的覺醒與黎明...』中的「黎明」指向「歌手黎明」。

因為超連結是藍色的,所以分外礙眼。

就這樣,兩篇嚴肅的文章,加上了個搞笑的連結!

由此可以看見數個問題:

首先,這軟件未能應付一詞多義。「黎明」一詞已這麼麻煩,想想「布殊」究意是老布殊還是小布殊!

其次,關鍵字庫不完備。可能明報因資源關係,或不希望有太多超連結,所以只把最熱門的詞匯放進關鍵字庫內。

第三,連結的準則不清。為甚麼「歌手黎明」及「胡錦濤」有連結,而「温家寶」沒有?

這問題也不是《明報》獨有,《雅虎新聞》也有同樣的問題。可能兩間公司用着相同的軟件。

《明報》所遇到的問題,《維基新聞》基本上解決了。以人手加上連結代替人工智能,避過了多數的一詞多義。以維基百科為後盾,資料庫已頗為完備,同時的解決連結準則不清的問題。

不過,《維基新聞》的新聞不多(幾可說是貧乏),人手可以應付;《明報》每天有數百篇新聞,犧牲速度,改用人手,會較為吃力;而《雅虎新聞》的來源是全世界,這樣做便不合情理。

事實上,《維基新聞》因以人工智能作繁簡體轉換,亦未能完全避過一詞多義的問題。當然,若你能忍受一篇文章同時有繁簡體,可以關閉繁簡互換的系統,避過這個問題。