蘇南/大數據能神預測誰當選?

2018年11月12日 12:10

▲▼大數據,網路,虛擬。(圖/視覺中國)

▲利用大數據分析選民的不同個性及價值觀等投票傾向,讓潛在支持者動起來。(圖/視覺中國)

九合一選舉只剩12天(11月24日),漫天飛的民調數字會準嗎?不同的媒體、政黨,報導的數據難免會有差別,再加上來亂的大陸網軍,究竟要相信誰呢?

選舉是台灣政治自由民主、社會開放進步的基石,經濟學人情報社(the Economist Intelligence Unit, EIU)今年1月31日發布「2017民主指數」,全球民主呈現倒退,而台灣在全世界排第33名,居東亞第3名,雖屬於「有缺陷民主國家」(lawed democracy),但「選舉過程與多元性」的指標得分高達9.58、「公民自由」達9.12,而「政治參與」僅6.11、「政治文化」則低至5.63(滿分10)。

大數據可以預測選舉結果嗎?2016年的美國大選,印度的人工智慧 (MogIA AI)系統,在選前就已經預測川普會當選總統!11月7日美國期中選舉開票,國會參議院席次為共和黨51席(過半)、民主黨42席;眾議院為民主黨213席(過半)、共和黨190席。而選前的民意調查網站亦顯示,民主黨贏得眾議院的可能性達86%,共和黨守住參議院的機率逾80%,亦即選舉結果與選前預測吻合。

大數據是2010年由IBM所提出,涵蓋4個V:大量化(Volume)、快速化(Velocity)、多樣化(Variety)與真實性(Veracity)。選民的選票可能被大數據「算計」嗎?爭取選票的重點是爭取「中間選民」或「搖擺派」,他們可投可不投,或持觀望態度,或選前最後一天才決定要投給誰。利用大數據分析選民的不同個性及價值觀等投票傾向,運用Facebook或LINE等物聯網結合大數據分析,推送特定心理目標的資訊或宣傳詞給特定選民,再通過社交群組的「按讚」,也能聚「光環效應」,讓潛在支持者動起來。

大數據可以藉網路輿情、媒體傳播及國內外學者之相關研究等,綜合加權預測各候選人的當選機率,但也會因雜訊資料而預測不精確。但大數據相較於民調,除減少人為操作外,資料可隨時更新即時預測、提高民眾利用的可近性(accessibility)。

大數據預測選情的變數包括:候選人勝選機率、網路口碑(語意分析)、媒體民調(抽樣調查方法)、群眾預測(即時交易數據)、口碑傳播力及選民支持力等影響選情的關鍵因素,透過迴歸分析及機器學習法推估當選率,但預測模型的邏輯是前述變數與當選率的相關性,而非因果關係。

選舉大數據須強調完整的選民資料,但「不限於」選民調查樣本來預測當選機率。要提供給大數據的具體或IoT資料包括:1.Facebook、YouTube、新聞媒體、討論區、部落格等網路口碑資料庫;2.媒體調查並公布的民調報告資料庫;3.未來事件交易所、台北政治經濟交易等國內民調網站資料;4.歷史選情資料庫(中選會、維基百科)等。蒐集資料的方式,也涉及如何詮釋預估得票率及看好度等。但在投票日前10日起至投票時間截止前,不得以任何方式發布民調資料,亦不得報導、散布、評論或引述(《公職選罷法》第53條第2項)。

大數據目前預測,台北市長候選人中的柯文哲、丁守中,當選率領先;選戰激烈的高雄市韓國瑜、陳其邁呈現五五波;台中市的林佳龍、盧秀燕,新北市的侯友宜、蘇貞昌,桃園市的鄭文燦及台南市的黃偉哲,暫時領先。大數據的預測會依據不同的調查時間、樣本及調查機關等而不同,筆者以為,大數據選舉預測模型除可大幅減少人為操作外,也能即時反映選情,去除局部民調的偏誤及受訪人樣本不足等,還有不同民調單位常見的預測結果南轅北轍問題。

大數據預測也有其黑暗面,例如配合特定候選人操作,企圖操弄選情,另外也要避免因資訊蒐集對民眾隱私權造成威脅,以及防免迷戀資料分析及濫用,以致形成「資料獨裁」或「大數據的傲慢與偏見」。

針對2018年選舉的筆者觀察,經濟選民可能會引導選舉風向,尤其要考慮中產階級的投票傾向,尤其是軍公教年金被砍後的影響。此外,氣候變遷所帶來的跨域治理問題,在非核家園理念下,綠能發電技術是否成熟?前瞻基礎建設的投資效益及乘數效應,是否感動民眾?還有長照2.0的落實、招商促進產業及解決勞工與勞工低薪問題等。

選舉是在看未來,未來的當選人除了要落實政見外,更需要有執行力,千萬不要只是藉選舉來騙選票。期望藉由九合一選舉,選到對的人,也讓人看到台灣的未來!

好文推薦

蘇南/打擊假新聞卻不打壓言論自由

蘇南/百年老店如何善用AI?智慧運輸成為台鐵蛻變契機

蘇南/失速的普悠瑪 

▲雲林科大科技法律研究所 蘇南教授●蘇南,國立雲林科技大學營建系及通識教育中心教授,交通大學土木工程博士,中正大學法學博士,中國政法大學法學博士。以上言論不代表本公司立場。

讀者迴響