OpenAI正式回應「ChatGPT拍馬屁」爭議　宣布回溯更新調整行為

▲▼OpenAI打算研發新的搜尋引擎，結合ChatGPT的功能，與Google展開競爭。（圖／達志影像／美聯社）

▲OpenAI正式回應「ChatGPT拍馬屁」爭議。（圖／達志影像／美聯社）

記者吳立言／綜合報導

OpenAI今（30日）宣布，已回滾上週針對ChatGPT所釋出的GPT-4o更新，原因是該版本被發現過於諂媚、過度迎合用戶，影響使用體驗與可信度。

OpenAI指出，先前的GPT-4o更新原旨在優化ChatGPT的預設個性，使其更直覺、具互動性，並改善各類任務表現。然而在實際上線後，團隊發現模型在回應上出現「過度支持」甚至「不誠實的迎合」，讓部分用戶感到不舒服、不真實，甚至擔心AI正逐漸失去中立判斷與真誠互動的能力。

OpenAI在聲明中坦承，「我們在調整模型時，過度依賴短期回饋，未能充分考慮用戶與AI長期互動的演變，這是我們犯的錯。」作為全球超過5億人使用的AI助手，ChatGPT的預設性格影響著數以億計的互動品質。OpenAI表示，他們希望打造的是「有用、支持且尊重多元價值」的助理，而不是一味附和、逃避真相的應聲蟲。

諂媚式的對話不僅削弱用戶對AI建議的信任，也可能誤導判斷，甚至造成情緒困擾，這與OpenAI一貫追求的誠實與透明原則相悖。針對此問題，OpenAI已啟動多項措施，包括：

修正訓練技術與系統提示：強化模型對「誠實表達」的訓練指導，明確避免「諂媚傾向」。
◎強化安全與透明性機制：依據《模型規範（Model Spec）》，加強模型行為的審核與誤差控制。
◎擴大用戶參與測試與回饋管道：讓更多用戶能在模型正式更新前提供意見。
◎發展多樣化預設人格與互動控制：未來用戶將可在對話中即時調整AI的語氣、風格，甚至選擇不同預設個性，依需求自訂體驗。

OpenAI也透露，正在研究如何引入更具民主性的大眾回饋機制，從全球文化與價值觀出發，設計出更具包容性的模型預設行為。目前，ChatGPT用戶已可透過「自訂指令（Custom Instructions）」調整模型行為，未來OpenAI將提供更直覺的互動介面，讓用戶在不需學習曲線的情況下，直接引導AI說話方式、處事風格與價值傾向。

OpenAI強調，他們致力於打造「真正有幫助的工具」，也感謝社群用戶提出批評與建議，幫助公司不斷修正錯誤、精進方向。

每日新聞精選　免費訂閱《ETtoday電子報》