▲OpenAI正式回應「ChatGPT拍馬屁」爭議。(圖/達志影像/美聯社)
記者吳立言/綜合報導
OpenAI今(30日)宣布,已回滾上週針對ChatGPT所釋出的GPT-4o更新,原因是該版本被發現過於諂媚、過度迎合用戶,影響使用體驗與可信度。
OpenAI指出,先前的GPT-4o更新原旨在優化ChatGPT的預設個性,使其更直覺、具互動性,並改善各類任務表現。然而在實際上線後,團隊發現模型在回應上出現「過度支持」甚至「不誠實的迎合」,讓部分用戶感到不舒服、不真實,甚至擔心AI正逐漸失去中立判斷與真誠互動的能力。
OpenAI在聲明中坦承,「我們在調整模型時,過度依賴短期回饋,未能充分考慮用戶與AI長期互動的演變,這是我們犯的錯。」作為全球超過5億人使用的AI助手,ChatGPT的預設性格影響著數以億計的互動品質。OpenAI表示,他們希望打造的是「有用、支持且尊重多元價值」的助理,而不是一味附和、逃避真相的應聲蟲。
諂媚式的對話不僅削弱用戶對AI建議的信任,也可能誤導判斷,甚至造成情緒困擾,這與OpenAI一貫追求的誠實與透明原則相悖。針對此問題,OpenAI已啟動多項措施,包括:
修正訓練技術與系統提示:強化模型對「誠實表達」的訓練指導,明確避免「諂媚傾向」。
◎強化安全與透明性機制:依據《模型規範(Model Spec)》,加強模型行為的審核與誤差控制。
◎擴大用戶參與測試與回饋管道:讓更多用戶能在模型正式更新前提供意見。
◎發展多樣化預設人格與互動控制:未來用戶將可在對話中即時調整AI的語氣、風格,甚至選擇不同預設個性,依需求自訂體驗。
OpenAI也透露,正在研究如何引入更具民主性的大眾回饋機制,從全球文化與價值觀出發,設計出更具包容性的模型預設行為。目前,ChatGPT用戶已可透過「自訂指令(Custom Instructions)」調整模型行為,未來OpenAI將提供更直覺的互動介面,讓用戶在不需學習曲線的情況下,直接引導AI說話方式、處事風格與價值傾向。
OpenAI強調,他們致力於打造「真正有幫助的工具」,也感謝社群用戶提出批評與建議,幫助公司不斷修正錯誤、精進方向。
讀者迴響