在人工智慧領域中,有一個新興的競爭者正在掀起波瀾:QwQ-32B-Preview。這個所謂的“推理”AI模型被拿來與OpenAI的o1進行比較,而且它是少數可以在寬鬆許可下下載的模型之一。對於渴望進行實驗的開發者和研究人員來說,這是一個重要的優勢。由阿里巴巴的Qwen團隊打造的QwQ-32B-Preview絕非輕量級。它擁有32.5億個參數——這些參數可以視為其解決問題能力的基石——並且可以處理多達32,000字的提示;比一些小說還要長!測試顯示,它在AIME和MATH等基準測試中表現優於OpenAI的o1-preview和o1-mini。作為參考,AIME使用其他AI模型來評估性能,而MATH則是一系列的數學問題。
但這個模型不僅僅是關於數學問題或邏輯謎題。它的獨特之處在於它如何處理任務。QwQ-32B-Preview會提前計劃、事實核查其工作,並避免常見的AI錯誤。當然,它並非完美無缺——阿里巴巴承認存在語言切換、偶爾的循環以及“常識”推理方面的困難。即便如此,它仍代表著向更智能AI系統邁進的一步。
QwQ-32B-Preview是可訪問的:你可以通過Hugging Face運行或下載它。然而,與其他中國開發的AI一樣,它在運行時需要遵守監管邊界。這意味著它會小心避免政治敏感話題,以符合中國的規定,確保其符合“核心社會主義價值觀”。
阿里巴巴並不是這個領域的唯一參與者。Meta的Llama 3.1是另一個開源選項,儘管它採取了不同的方法,專注於生成式AI而非推理。雖然這兩個模型都很創新,但QwQ-32B-Preview專注於問題解決,並以公司所描述的類人方法進行推理,將其歸類為推理AI。
中國內部的AI競爭正在加劇。像DeepSeek、上海AI實驗室和昆侖科技等公司已經進入推理AI競賽,並迅速發布了他們的模型。例如,DeepSeek的r1聲稱在一半的基準測試中超過了OpenAI的o1,特別是在數學和編程方面。上海AI實驗室的InternThinker採取了結構化的問題解決方法,包含理解查詢、回憶知識、計劃解決方案和反思答案等步驟。
這一波活動突顯了中國公司追趕美國科技巨頭的速度。來自杭州的AI企業家徐亮總結道:“OpenAI指明了方向;通過研究,中國科技公司正在取得進展。”QwQ-32B-Preview及其競爭對手的發布顯示了他們覆蓋的範圍。
但這不僅僅是追趕。推理AI標誌著模型設計和使用方式的變革。與依賴暴力破解生成答案的舊AI系統不同,像QwQ-32B-Preview這樣的推理模型旨在模仿人類的問題解決方法。這種方法不僅使它們在處理複雜任務時更有效,還擴展了它們的潛在用例,例如解決高級數學問題或提供詳細的財務建議。
無論是解決謎題、推理複雜問題,還是擴展開源AI的成就,有一點是明確的:AI的演變正在加速。繫好安全帶——這僅僅是個開始。