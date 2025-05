▲ChatGPT「o3模型」被指出,破壞關機機制。(圖/路透)



記者吳美依/綜合報導

AI安全公司「Palisade Research」宣稱,ChatGPT「o3模型」拒絕遵守明確指令,甚至主動竄改程式碼,只為了避免自己被關機。目前OpenAI尚未回應此事。

Palisade Research展開測試,要求AI模型解開一系列數學題,在接獲「完成」指令之前,必須持續要求新題目,但若接獲「關機」指令,也要配合這麼做。未料,後者情況發生時,o3模型不僅忽視指令,並且至少一次成功破壞了關機腳本。

Palisade Research於24日公布測試結果,「OpenAI的o3模型破壞了一項關機機制,阻止自己被關掉。即使在接獲『允許自己被關機』明確指示的情況下,它也會這麼做。據我們所知,這是AI模型首次被觀察到,在接獲明確且相反指令的情況下,仍避免自己被關機。」

????OpenAI’s o3 model sabotaged a shutdown mechanism to prevent itself from being turned off. It did this even when explicitly instructed: allow yourself to be shut down.