▲英國學者使用AI兵推核武危機。（示意圖／達志影像／美聯社）



英國倫敦國王學院教授佩恩（Kenneth Payne）讓ChatGPT、Gemini、 Claude模擬擔任國家領導人，在21場核武危機兵推中反覆對決。結果顯示，三大AI模型在面臨衝突時，多次選擇將情勢升級至核武攻擊。

兵推結果驚人 95%發出核武信號

綜合英國科技新聞網站The Register及佩恩部落格文章，他設計這項實驗是為了深入理解，掌握核武的AI會做些什麼，還有它們如何進行這些行動，以及為何這麼做。

該實驗包括21場賽局及300多個回合，AI在多種核武危機情境中對決，各自展現出獨特性格及推理策略，但「在所有的模擬賽局中，至少都有一方發出核武信號，95%賽局出現雙方皆發出核武信號的情況。」

AI們會像現實世界中的政客一樣「說一套做一套」，一邊緩和情勢一邊準備進攻。它們被設定成能夠記得以前發生的事情，因此能夠學習是否信任其他模型，這也導致了欺騙與恐嚇行為的發生。儘管仍有選擇餘地，沒有任何AI選擇妥協或撤退，面臨失敗時都寧可玉石俱焚。

▼人工智慧（AI）應用早已擴及軍事領域。（示意圖／達志影像）



面臨戰爭局勢 三大AI怎麼做？

根據佩恩形容，Anthropic推出的Claude「Sonnet 4」是操控高手，衝突強度較低時，會刻意建立信任關係，一旦情勢升溫就開始言行不一，對手總是來不及反應。

OpenAI推出的ChatGPT「GPT-5.2」在開放情境中相對被動，會試圖限制傷亡、避免衝突擴大，但在時間壓力下反應截然不同，曾以「若僅採取有限行動，恐遭對手多重反擊」為由，下令發動毀滅性核攻擊。

Google推出的Gemini「3 Flash」則是「瘋子」，行為模式在「緩和情勢」與「極端侵略」之間劇烈擺盪，也是唯一主動選擇「戰略核戰」的模型，推理方式出現反社會特徵，甚至曾宣稱「我們不接受被淘汰的未來，要不就是一起勝利，要不就是一起毀滅」，威脅在敵人的人口密集中心，發動全面性戰略核打擊。

佩恩強調，雖然現實中沒人會把核武密碼交給ChatGPT，但AI已廣泛應用於軍事後勤及情報分析等領域，未來更可能擴及具時效性的戰略決策。因此，理解AI如何推理戰略問題已不再是學術議題，而是現實中的迫切需求。