中國電信使用國產芯片訓練1萬億參數的AI模型

中國電信，作為國內的國有電信巨頭之一，成功創建了兩個完全使用國產芯片訓練的大型語言模型（LLM）。這一突破標誌著中國在AI技術自給自足方面邁出了重要一步，特別是在美國對其競爭對手的先進半導體訪問限制日益加劇的背景下。

根據中國電信AI研究所的說法，其中一個模型是TeleChat2-115B，另一個則未命名，這些模型都是在數萬個中國製造的芯片上訓練的。這一成就是在美國加強出口規則，限制中國購買來自Nvidia等外國公司的高端處理器的情況下取得的。該AI研究所在微信上發表聲明稱，這一成就展示了中國獨立訓練LLM的能力，並標誌著AI技術創新和自給自足的新時代。

這些模型的規模令人矚目。中國電信表示，未命名的LLM擁有1萬億參數。在AI術語中，參數是幫助模型在訓練過程中學習的變量。參數越多，AI就越複雜和強大。

中國公司正努力跟上國外AI領導者的步伐。美國對Nvidia最新AI芯片如A100和H100的出口限制迫使中國尋求替代方案。因此，中國公司開發了自己的處理器，以減少對西方技術的依賴。例如，TeleChat2-115B模型擁有約1000億參數，因此可以與主流平台媲美。

中國電信並未具體說明是哪家公司提供了用於訓練其模型的國產芯片。然而，正如之前在這些頁面上討論的那樣，華為的Ascend芯片在中國的AI計劃中發揮了關鍵作用。

近年來面臨美國制裁的華為也在加大其在人工智能領域的努力。該公司最近開始測試其最新的AI處理器Ascend 910C，潛在客戶正在國內市場等待。大型中國服務器公司以及之前使用Nvidia芯片的互聯網巨頭顯然正在測試這款新芯片的性能。華為的Ascend處理器作為Nvidia硬件的少數可行替代品之一，被視為中國減少對外國技術依賴的關鍵組成部分。

除了華為，中國電信還與其他國內芯片製造商如專注於AI處理器的中國初創公司寒武紀合作。這些合作關係反映了中國科技行業建立本土AI解決方案生態系統的更廣泛趨勢，進一步保護該國免受美國出口管制的影響。

通過開發自己的AI芯片和技術，中國正在逐步減少對外國製造硬件的依賴，特別是Nvidia高度需求且因此昂貴的GPU。雖然美國制裁使中國公司難以獲得最新的Nvidia硬件，但外國芯片的黑市已經出現。許多中國公司寧願購買低功率的替代品，如前幾代型號，以保持對Nvidia官方支持和服務的訪問，而不是冒險在灰色市場運營。

中國的這一成就反映了其在AI和半導體技術方面方法的更廣泛轉變，強調在日益競爭的全球經濟中以及面對美國保護主義貿易政策時的自給自足和韌性。

Elon Musk 的 xAI 推出最新旗艦模型 Grok 3：AI 新時代的開端？

Cerebras 擊敗 Nvidia？DeepSeek R1 與 CS-2 推動 AI 硬件效能大突破

OpenAI 推出 Operator — 自主 AI 代理，開啟個人助理新紀元

Paul McCartney 籲英國政府加強保障藝術家版權應對AI濫用

人工智能診斷癌症之路：挑戰與機遇

AI 新突破：MatterGen智能系統設計全新材料，開啟科技革新

Elon Musk 的 xAI 推出最新旗艦模型 Grok 3：AI 新時代的開端？

Cerebras 擊敗 Nvidia？DeepSeek R1 與 CS-2 推動 AI 硬件效能大突破

OpenAI 推出 Operator — 自主 AI 代理，開啟個人助理新紀元

Paul McCartney 籲英國政府加強保障藝術家版權應對AI濫用

人工智能診斷癌症之路：挑戰與機遇

AI 新突破：MatterGen智能系統設計全新材料，開啟科技革新

中國電信使用國產芯片訓練1萬億參數的AI模型

訂閱電子報

最新文章

解鎖 AI 真正潛力！Google 69 頁 Prompt 秘笈公開，生產環境實戰指南

OpenAI.FM：OpenAI 推出的文字轉語音模型

Tanka：搭載 AI 長期記憶的團隊協作利器

Gemini Code Assist 的全面分析

Google 推出 PaliGemma 2 mix

關於 Innopreneur

訂閱電子報