近年來,隨著國內大模型的蓬勃發展,GPU在AI領域的重要性再次凸顯。于是,越來越多的國產GPU廠商逐漸涌現,并在市場中占據了一定的份額。
然而,GPU技術也的確存在著高壁壘和生態建設難等問題,這使得燒錢搞研發成為了國產GPU廠商難以逃避的行徑。但這對于一些廠商而言,并非擁有如此充足的資金去支撐GPU芯片的投入。
國產GPU,陷入困境
9月1日,國產GPU企業象帝先通過官方公眾號發布公告,針對此前有關“象帝先公司全員解散”等不實傳言進行澄清。然而,據有關信息透露,該公司確實正在進行一輪大規模的裁員行動,補償方案遵循了N+1的標準。
象帝先成立于2020年9月,專注于高性能通用及專用處理器芯片的設計。公司先后在北京、上海、重慶、成都、蘇州等地設立了研發中心。據悉,公司曾推出天鈞一號和天鈞二號GPU,這些產品主要面向桌面、高性能計算及云服務等應用場景。而且按照公司宣傳的目標,天鈞一號、天鈞二號如果能規模量產,將填補國內高性能通用GPU芯片市場空白。
然而,隨著市場競爭的加劇和融資環境的惡化,象帝先在尋求融資的過程中曾面臨一定的挑戰。2023年時,象帝先公司曾按照120億的投前估值尋求融資未果,后降至80億估值仍未尋求到新的資金輸血。
此外,幾個月之前,也有一則關于“國產GPU礪算科技瀕臨破產”的消息在業內不脛而走。有傳言稱,該公司早在去年6月就出現了欠薪問題,并且到現在都沒有徹底解決。
不過,相比于象帝先,幸運的是礪算科技在今年迎來了轉機。8月20日,東芯半導體股份有限公司發布對外投資公告,公司擬通過自有資金2億元向國產GPU廠商——礪算科技(上海)有限公司(上海礪算)增資,認購其新增注冊資本500萬元。
根據公開資料顯示,礪算科技是一家致力于研發多層次(可擴展)圖形渲染GPU的公司。公司基于自研“盤古”架構,成功研發出國內首款6nmGPU芯片,性能比肩英偉達高端顯卡。
近日,千億“AI芯片第一股”寒武紀發布了2024年半年度報告,公司仍未走出虧損困境。根據報告顯示,公司上半年實現的營業收入為6476.53萬元,同比下降43.42%;歸屬于母公司的凈利潤為-5.3億元,經調整后凈利潤為-6.09億元,虧損仍在持續。
國產GPU,也在逐漸落地開花
相比于英偉達等國際大廠,雖然國產GPU起步較晚、聲勢較小,但在艱難爬行前進的道路上,國產GPU也在不斷開花結果,國內不少廠商成長之快,在某些領域逐漸有所建樹。
在7月份的2024 WAIC上,包括壁仞科技、摩爾線程、無問芯穹、天數智芯、燧原科技等國產AI芯片公司集體精彩亮相并紛紛展示了自己的AI產品線,向世界展現了中國強大的“芯”力量。
壁仞科技:從硬件集群算力、軟件有效算力、異構聚合算力三個維度入手,通過chiplet架構、單節點8卡全互連、千卡集群建設方案等技術創新,有效解決了算力瓶頸問題。此外,壁仞科技開發了異構聚合算力技術,支持壁仞GPU與英偉達A100 GPU協同訓練,效率超過90%。
摩爾線程:宣布其AI旗艦產品夸娥(KUAE)智算集群解決方案升級,在GPU顯存和傳輸帶寬方面,夸娥萬卡集群具備PB級顯存總容量、每秒PB級超高速卡間互聯總帶寬和節點間互聯總帶寬,全面提升集群計算性能。
無問芯穹:發布了千卡規模異構芯片混訓平臺,稱這一訓練集群算力利用率最高達到了97.6%。無問芯穹Infini-AI云平臺已集成大模型異構千卡混訓能力,是全球首個可進行單任務千卡規模異構芯片混合訓練的平臺,具備萬卡擴展性。
天數智芯:聯合合作伙伴推出大模型推理16卡服務器,搭載16張自主研發的智鎧100推理卡,性能和性價比達到國際一流水平。同時,天數智芯與愛特云翔合作建設千卡GPU算力集群,可支持千億以上參數大模型的全量預訓練,支持客戶進行微調、參數高效微調等服務,解決了大模型訓練高端算力緊缺的瓶頸問題。
燧原科技:展示了智算中心落地案例和里程碑系列產品,還帶來了基于燧原算力的AIGC交互體驗站,展示其最新商業落地成果及規模化應用。同時燧原科技還展示編程助手、AI視頻生成、3D生成等交互技術。
……
值得一提的是,近日中國證監會披露了燧原科技首次公開發行股票并上市輔導備案報告,其IPO輔導機構為中金公司。根據了解,自2018年成立以來,燧原科技已完成十輪融資,累計融資額近70億元,背后知名投資機構云集,其中騰訊更是連續六輪參投。
目前,燧原科技的核心業務涵蓋了芯片、板卡、智算一體機、液冷算力集群以及配套的軟件系統,包括基于“邃思”的云端訓練加速卡“云燧T10”和第一代推理產品“云燧i10”以及第二代訓練產品“云燧T20/T21”和推理產品“云燧i20”,還有配套的“馭算”軟件平臺等等。
此外,在9月6日-7日的全球AI芯片峰會(GACS 2024)上,壁仞科技也宣布取得多芯混訓核心技術突破,打造出異構GPU協同訓練方案HGCT,其是業界首次能夠支持3種及以上異構GPU訓練同一個大模型,即支持用「英偉達+壁仞+其他品牌GPU」混訓,通信效率大于98%,端到端訓練效率達到90~95%。