中國電信,作為國內的國有電信巨頭之一,成功創建了兩個完全使用國產芯片訓練的大型語言模型(LLM)。這一突破標誌著中國在AI技術自給自足方面邁出了重要一步,特別是在美國對其競爭對手的先進半導體訪問限制日益加劇的背景下。
根據中國電信AI研究所的說法,其中一個模型是TeleChat2-115B,另一個則未命名,這些模型都是在數萬個中國製造的芯片上訓練的。這一成就是在美國加強出口規則,限制中國購買來自Nvidia等外國公司的高端處理器的情況下取得的。該AI研究所在微信上發表聲明稱,這一成就展示了中國獨立訓練LLM的能力,並標誌著AI技術創新和自給自足的新時代。
這些模型的規模令人矚目。中國電信表示,未命名的LLM擁有1萬億參數。在AI術語中,參數是幫助模型在訓練過程中學習的變量。參數越多,AI就越複雜和強大。
中國公司正努力跟上國外AI領導者的步伐。美國對Nvidia最新AI芯片如A100和H100的出口限制迫使中國尋求替代方案。因此,中國公司開發了自己的處理器,以減少對西方技術的依賴。例如,TeleChat2-115B模型擁有約1000億參數,因此可以與主流平台媲美。
中國電信並未具體說明是哪家公司提供了用於訓練其模型的國產芯片。然而,正如之前在這些頁面上討論的那樣,華為的Ascend芯片在中國的AI計劃中發揮了關鍵作用。
近年來面臨美國制裁的華為也在加大其在人工智能領域的努力。該公司最近開始測試其最新的AI處理器Ascend 910C,潛在客戶正在國內市場等待。大型中國服務器公司以及之前使用Nvidia芯片的互聯網巨頭顯然正在測試這款新芯片的性能。華為的Ascend處理器作為Nvidia硬件的少數可行替代品之一,被視為中國減少對外國技術依賴的關鍵組成部分。
除了華為,中國電信還與其他國內芯片製造商如專注於AI處理器的中國初創公司寒武紀合作。這些合作關係反映了中國科技行業建立本土AI解決方案生態系統的更廣泛趨勢,進一步保護該國免受美國出口管制的影響。
通過開發自己的AI芯片和技術,中國正在逐步減少對外國製造硬件的依賴,特別是Nvidia高度需求且因此昂貴的GPU。雖然美國制裁使中國公司難以獲得最新的Nvidia硬件,但外國芯片的黑市已經出現。許多中國公司寧願購買低功率的替代品,如前幾代型號,以保持對Nvidia官方支持和服務的訪問,而不是冒險在灰色市場運營。
中國的這一成就反映了其在AI和半導體技術方面方法的更廣泛轉變,強調在日益競爭的全球經濟中以及面對美國保護主義貿易政策時的自給自足和韌性。