▲Windsurf這次共推出三款SWE-1系列模型。(圖/Windsurf)
記者吳立言/綜合報導
Windsurf今(16日)宣布推出全新軟體工程模型系列「SWE-1」,標榜優於現有開源模型,接近Claude 3.5 Sonnet級別的推理能力,並可免費提供付費用戶限時試用。
Windsurf這次共推出三款SWE-1系列模型,分別為:
SWE-1:針對完整軟體工程流程打造,可處理多步驟任務與不完整狀態,支援終端機指令、使用者回饋、測試驗證等複雜作業,效能接近Claude 3.5 Sonnet,但執行成本更低。
SWE-1-lite:中型模型,主打取代原有Cascade Base,提供所有用戶免費無限使用。
SWE-1-mini:極小型模型,主打快速回應,適用於Tab被動預測體驗。
Windsurf表示,SWE-1的設計目標是加速整體軟體開發流程,而非僅限於程式撰寫。模型可協助理解使用者需求、回應編輯器中的修改、觀察終端機錯誤訊息、理解UI元件錯誤,甚至參與版本測試與使用者反饋的處理。這樣的「全流程感知能力(flow awareness)」是Windsurf系統設計的核心。
Windsurf 認為,真正有效的AI模型必須與使用者共享「時間軸」。這意味著模型能即時感知使用者行為,例如編輯器變動、終端機錯誤、複製內容、搜尋操作,並做出即時回應。這項設計已應用於Cascade與Tab工具中,未來SWE系列模型也將全面整合這一機制,強化人機協作。
為驗證SWE-1的實際效能,Windsurf採用了離線測試與真實用戶實驗兩種方式進行評估。首先,在離線測試中,團隊透過模擬實際軟體開發場景,安排模型執行單元測試並回應使用者查詢,進一步比較SWE-1與Anthropic、DeepSeek、Qwen等市面上常見的熱門模型之表現。
同時,Windsurf也進行了大規模的用戶實驗,隨機將不同使用者分配至不同模型,並在用戶不知情的情況下,觀察各模型每日實際貢獻的程式碼行數,以及在用戶保留的檔案修改中所占的比例。結果顯示,SWE-1無論在離線測試還是實際使用情境中,其整體表現都幾乎與業界前沿的基礎模型相當,同時也穩定優於所有開源模型與中型模型,證明其具備競爭力的實用價值。
Windsurf表示, SWE-1是小型工程團隊所達成的首次突破,未來將持續投入資源擴充SWE系列,目標是超越所有研究實驗室所開發的基礎模型,打造真正能協助開發者從需求到部署的全能AI工具。目前Windsurf也正擴大機器學習研究團隊,號召更多工程師投入SWE模型的下一階段開發。
讀者迴響