記者蘇晟彥/綜合報導
騰訊旗下「騰訊混元」21日宣布,推出自家AI深度思考模型「混元T1」正式版,根據官方資料顯示,混元T1的強項在於推理能力、長文處理及成本控制,目前在API的使用費用為輸入/輸出:每百萬tokens 1/4元人民幣,同時官方也公布測試數據,儘管跟OPEN AI-o1相比略為遜色,但仍勝過GPT4.5及DeepSeek R1。
據官方介紹,「混元T1」通過大規模強化學習,並針對數學、邏輯推理、科學和代碼等理科難題進行了專項優化,進一步提升了推理能力。在多項公開基準測試中,「混元T1」的成績均達到業界領先推理模型的水平:
在大語言模型評估增強資料集MMLU-PRO中,取得87.2分,僅次於OpenAI o1。
「混元T1」採用Hybrid-Mamba-Transformer融合架構,這是首次將混合Mamba架構無損應用於超大型推理模型。該架構有效降低了傳統Transformer結構的計算複雜度,減少了KV-Cache的儲存佔用,從而顯著降低了訓練和推理成本。在CEval、AIME、Zebra Logic等中英文知識及競賽級數學、邏輯推理的公開基準測試中,也達到業界領先水平,儘管略輸於OPENAI-o1,但仍勝過GPT4.5及DeepSeek R1。
目前在API的使用費用為輸入/輸出:每百萬tokens 1/4元人民幣,
讀者迴響