一段時間以來,將高、低精度數學運算相融合以加快科學發現的方法,成為技術行業熱議的話題。AMD公司CEO蘇姿豐在去年的ISSC主題演講中表示,這種混合精度方法能夠大幅降低電力需求,以有意義的方式擴展計算規模,將相當一部分負載從超級計算集群當中解放出來。
換句話說,與其用寶貴的計算資源解決更多問題,不如嘗試用它解決更重要的問題。
HPC(高性能計算)主要以高精度模擬為核心。但在實際操作之前,我們首先需要確定待測試的理想目標或者預設性前提。在這方面,我們不必部署HPC資源來測試一項又一項假設,而更適合用精度雖低、但速度更快的AI模型來幫助篩選所有可能的潛在方案,直至找出完美的模擬條件。
這也正是微軟Azure Quantum Elements(量子元素,簡稱AQE)團隊與美國能源部太平洋西北國家實驗室(PNNL)之間多年來采取的合作模式。
在最近博文中詳盡闡述的概念驗證部分,西北國家實驗室與量子元素團隊將微軟掌握的巨量計算資源用于處理AI/機器學習與HPC混合工作負載,希望借此加快實驗性電池的開發進度。這一次,微軟不再滿足于簡單使用他人提供的單體(cell)設計更好的不間斷電源(UPS)。
需要注意的是,盡管名為Azure量子元素團隊,但此次實驗并非借助量子計算技術。目前科技界的普遍共識是,能夠用于精確建模的量子系統還需要幾年時間才可能面世,但好消息是材料科學將成為最先從該技術中獲益的探索領域之一。
短短幾周之內,該團隊就將問題表述成功轉化為基于新發現化合物的實際成果。而且該項目最令人印象深刻的要數計算耗費的時間——總計只有80個小時。可以想見,如果未來投入更多資源,計算周期還可以進一步縮短。
量子元素與西北國家實驗室在實現這一壯舉的過程中,嘗試了機器學習與模擬技術的多種具體應用。
第一步就是訓練AI模型以評估不同材料的預期特性,并找到有希望的組合。通過運行相應算法,系統首先將候選化合物范圍縮小到3200萬種。雖然數量仍然太大、無法直接測試,但這還僅僅是首輪篩選。
雙方隨后對數據集開展進一步排序和簡化,根據化合物的穩定性、反應性和導電潛力來識別有潛力的組合。這個篩選、模擬、再篩選的過程將范圍縮小至50萬種,并最終確定為800種化合物。
從這里開始,研究人員轉而應用各種HPC模型。例如,首先使用密度泛函理論來計算每種材料在不同狀態下的能級,接下來采用HPC與AI的結合以模擬各種材料的分子動力學特性,而后分析其內部原子運行。通過這個過程,研究人員將可行的候選化合物數量縮減到了150種。
最終,雙方對數據集進行第三輪模擬,以確定哪些在成本、時間和可用性方面最為突出。由此,西北國家實驗室與量子元素團隊整理出一份包含18種以往從未被發現的化合物候選清單。
其中最有趣的部分,當數計算資源的具體分布。傳統觀點一直認為雙精度HPC工作負載需要耗費大量計算時間,但此次實驗證明未必如此。
根據微軟的介紹,實驗中90%的計算資源被用于機器學習類任務,旨在縮小候選化合物的范圍。在全部80個小時的計算總量中,只有10%用于HPC工作負載。
無論如何,模擬終歸只是模擬。作為對化學反應和工藝行為的最優近似計算結果,我們仍然需要實踐測試來驗證自己的發現。也正因為如此,除了投入數以億計的美鈔打造超級計算機來模擬美國的核儲備效果以外,能源部還在地底深處開展了亞臨界測試,希望了解這些模擬結果與現實場景間是否一致。
因此,在確定了最有希望的候選材料(由70%的納和30%的鋰組成的固態電解質)之后,西北國家實驗室開始著手制造實體電池。整個過程包括合成化合物、研磨、壓制,而后將材料加熱至450至650攝氏度。但與計算階段相比,實操過程相對較快,大約需要10個小時即可完成。
在傳統上,能量密度最高的電池(包括電動汽車、筆記本電腦、智能手機和電動工具中使用的電池)通常需要用到鋰元素。可遺憾的是,這種元素既缺乏可持續性、采集難度也極大。而另一方面,鈉元素在地球上的儲量則相對豐富,因此價格更為低廉。可問題是鈉本身的能量密度遠不及鋰。通過將二者相結合,微軟和西北國家實驗室似乎成功在材料供應與能量密度之間找到了最佳平衡點。
而且在為發現新的電池化合物而興奮之余,西北國家實驗室首席數字官Brian Abrahamson也在微軟的介紹博文中強調,此番實驗的最大亮點其實跟電池化合物本身關系不大,而在于研究團隊能夠以怎樣的速度完成探索。
在以往的電池研究當中,例如釩氧化還原液流電池,西北國家實驗室的整個開發周期長達數年。相較于此次不足100小時的完整開發過程,不禁讓人對AI+HPC的組合模式心生期待。
這種電池最終是否可行仍然有待觀察。根據微軟和西北國家實驗室的介紹,測試階段需要生產數百個原型電池,這肯定需要相當長的時間。
然而,西北國家實驗室與微軟也在考慮加快制造過程的方法。該實驗室材料科學小組負責人Vijay Murugesan建議為化學與材料科學開發數字孿生模型,借此縮短測試時間。
近年來,英偉達無疑是數字孿生推廣中的先驅者與核心力量。該公司強調,數字孿生有望成為企業(特別是物流與制造業企業)在方案實際落地前,以數字方式測試各種生產變化的重要手段。
在西北國家實驗室,Murugesan建議研究人員將陽極、電解質、電壓及其他因素的詳細信息輸入數字孿生,據此預測實驗結果。一旦獲得成功,這種方式必將大大加快新型化學物質的發現與產品轉化。
說到這里,雖然微軟與西北國家實驗室之間的合作還主要集中在電池技術領域,但軟件巨頭同時強調,機器學習算法在設計上立足于通行的化學原理,可以應用于涉及材料科學的各種實際問題。
所以至少就目前來看,此項目已經初步展現出我們利用計算資源(包括低精度、高精度及雙精度混合)解決完整問題的可能性。