賴祥蔚／川普下台後　假新聞仍難解　Al＋大數據能終結假訊息嗎？

我們想讓你知道…Al以及大數據如果想要從「形式」去辨別假訊息，主要只能應付由Al以及大數據製造的假訊息。至於人工製造的假訊息，目前還不容易以Al以及大數據直接進行辨別。

▲ 衛生局提醒民眾亂傳假訊息，將開罰最重300萬元。（圖／記者唐詠絮翻攝）

● 賴祥蔚／台灣藝術大學廣播電視學系教授

假訊息與假新聞是2016年川普參選及當選美國總統以來，全世界都關心的議題。轉眼四年多過去，川普已經連任失利而卸任，但是假訊息與假新聞的解決至今仍未有理想方案。

處理假訊息的方式，目前主要是靠人工處理。近年來，不少人試圖以及Al大數據辨別假訊息。Al以及大數據能辨別假訊息嗎？或許可以從原理及最新發展來分析。

假訊息 vs 錯誤訊息　傻傻分不清？

首先，很多人常常混淆假訊息與假新聞，一般來說，假新聞的製造者必須是新聞媒體，範圍有限，假訊息的範圍則泛指所有訊息。

假訊息（Disinformation）主要針對經過刻意編造，用以傷害特定對象的訊息，意圖謀取特定利益。相較來看，有一個類似但不同的概念是「錯誤訊息」（Misinformation），亦即內容雖有錯誤，但並非意圖傷害而刻意製造的訊息。

▲ 機器人可製造假訊息，也可辨識詐騙資訊。（圖／翻攝自趨勢科技防詐騙達人網站）

辨識假訊息　人工＋AI＋大數據

其次，假訊息可以從兩個向度來分類：製造者、內容；製造者，可概分為人工、機器人；內容，則可以概分為文字、影像。

人工假訊息，人人皆可做到，只是有人敢做、有人不願做而已。至於Al人工智慧，基礎原理之一是「機器學習」（Machine Learning），透過資料庫來讓機器學習，可以學習如何製造假訊息，當然也可以辨別假訊息。因為透過資料庫，所以也是大數據分析。

當前機器人已經成為假訊息操作的主要手法，透由機器人帳號（BOTs）在網路社群散佈訊息方式，並巧妙利用演算法提高訊息曝光率。

▲美玉姨使用g0v的「Cofacts真的假的」開放式資料庫，分析line群組的假消息。（圖／實習記者魏雅芬攝）

目前海內外辨別假訊息的方式，都是結合人工與AI及大數據，例如「Fake News Net」主要分析推特上面的假訊息，加入訊息時間與擴散性的維度，能夠了解訊息傳播路徑與軌跡。「美玉姨」是使用g0v的「Cofacts真的假的」開放式資料庫，人工協助查證訊息真偽後寫入資料庫，以便後續的比對。

有專家指出，可以從文章語彙、用字的語言特徵、標點符號去辨別是否是假訊息，更認定假訊息通常會使用較低層級、較簡單的文字。對此，汪志堅教授的研究很值得一提，剛好可以看出人工與機器人製造的假訊息，在辨別的不同挑戰。汪教授使用兩個資料庫：「Cofacts真的假的」與「新聞小幫手」，後者準確率達到88%；但前者因為不乏來自Line的內容，變化性太大，不像新聞有固定撰寫格式，準確率只有67%。