“‘賦能’這個詞低估了人工智能對科學的影響。就科學而言,人工智能不是一次簡單的工具革命,而是科學革命的工具,或者說是具有革命性的工具。”
在2月19日舉行的世界互聯網大會“人工智能賦能科學研究”(AI For Science)研討會上,世界互聯網大會人工智能專業委員會首席主任委員、中國工程院院士、之江實驗室主任王堅提到上述觀點。
王堅坦言,過去幾年他不敢直接表達這個觀點,而十天前,當麻省理工學院(MIT)的幾位學者看到中國帶來的變化后,他們意識到,中國不只是一家公司(或有錢的公司)能做出好的基礎模型,這對大家是很大的鼓舞。人工智能已成為通用語言,將打破學科壁壘,所以它不只是簡單的賦能,可能是一種新的范式。
王堅表示,科學研究的第一、第二范式都已經在科研中廣泛驗證,第三范式即計算機被引入,基本是計算機模擬階段;而第四范式,即由數據驅動的范式從未形成過;關于第五范式的說法不一,但普遍認為第五范式與人工智能有關系,這已形成共識。
會上,王堅還強調了科研資源開放的重要性。大模型時代的開源實際上是資源開放,科學研究需要公共產品。當數學、人工智能和工程學等都很好地結合時,面向全世界的公共科學研究的公共產品就會出現。這個公共產品不再像過去那樣只被少數幾個科學家所擁有,而是成為大家都能使用的工具。
發展至今,AI for Science(AI4S)的概念已逐漸被更多人了解。尤其是去年10月,2024年諾貝爾物理學獎和化學獎相繼頒給在人工智能與基礎科學交叉領域實現重大突破的科學家,標志著人工智能在科學研究中的重要地位得到了認可。
人工智能正在引發一場從科研范式、科研方法到應用場景的系統性的變革。
例如,在生物藥領域理解多種藥物相互作用產生的復雜影響,在氣象分析領域處理長時間跨度的海量氣象信息等等,為科研人員提供了全新視角和分析工具,推動科研方向向智能化數據驅動轉變。
再比如,中山大學與阿里云合作研究,利用云計算與AI技術發現了180個超群、16萬余種全新RNA病毒,是已知病毒種類的近30倍,大幅提升了業界對RNA病毒多樣性和病毒演化歷史的認知。
除此之外,阿里巴巴集團副總裁、大數據和智能實驗室負責人葉杰平提到,阿里云還服務了中科院國家天文臺、FAST望遠鏡數據上云、復旦大學科研智算平臺等多個重大科研項目。
葉杰平表示,相比20年前、10年前、甚至5年前,現在AI大模型在整個科研流程方面都可以發揮非常大的價值。預計如果AI模型能力持續提升,科學家做科研的方式會發生深刻的變革。
“AI4S的能力在于有一個非常強的超高緯度數據擬合能力。”中國新一代人工智能發展戰略研究院執行院長龔克提到,科學的第一范式是靠觀察,并在此基礎上形成定理,其實就是通過觀察數據擬合出自然界規律。
但要在高維空間中做擬合非常難,甚至無法表達,而現在高度復雜的神經網絡能表達大量數據中真實世界的高維度特性。另外,做數據處理時,從微觀到宏觀的跨尺度數據處理非常困難,而人工智能也做到了。
在龔克看來,歸根結底,這些體現的是AI的學習能力。人工智能自從走上機器學習這條路,就越走越通,因為學習是智能的本質所在。同時,人工智能還具有通用性,它不是一個領域的工具,而是涉及所有領域的工具,可以帶來革命性變化的工具。
龔克建議,要繼續提升AI4S本身的能力,特別要增強模型的可解釋性和透明度,并且共同制定標準和規范。
與此同時,應促進資源共享,加強跨學科、跨行業的交流合作,來開發開源的、開放的科學創新模式;此外還要提升研究者有道德負責任運用AI4S的能力,恪守科研誠信。
“AI4S雖然具有挑戰性,但與“AI+X”的其他領域相比,相對更容易取得確定的成果。”專委會副主任委員、產業推進計劃牽頭人,歐洲科學院外籍院士,清華大學人工智能研究院常務副院長孫茂松表示,AI4S的對象是存在不變規律的自然科學,這正適合人工智能處理。相比之下,應用于社會科學等其他領域反而更困難。
例如小分子、大分子結構是固定的,所以人工智能在自然科學領域的應用,盡管本身有難度,但從性質上來說是最容易的,而且由于其與傳統方法不同,使用它一定會取得超出該領域思維定式的結果。
在應用AI4S時,孫茂松認為有兩點要認真審視:一是要發現根節點問題,解決它可能會對該領域產生根本性變革,如AlphaFold選擇的蛋白質結構預測問題;
二是要確保問題有高度相關的高質量數據,且是人做得不太好的領域。此外,參加公開學術比賽也是一條捷徑,AlphaFold就是通過參加學術比賽取得第一,從而推動了自身發展。
孫茂松還提到AI4S的另一面——Science for AI以及Science in AI。在他看來,目前大模型雖取得了顯著成果,但對于其產生能力的機理卻尚未明晰,例如DeepSeek在一些中文復雜任務中的表現令人驚嘆,可沒人能說清背后的原理。
他認為,研究大模型的機理迫在眉睫,“一旦揭示清楚,可能會推動人工智能的大發展,實現經驗主義與理性主義的結合,做到小模型、小數據、高效,并且研究大模型對腦科學的發展也有著巨大的促進作用”。
深勢科技創始人兼CEO孫偉杰在圓桌論壇中表示,如今在AI4S時代下,AI可以幫大家更好地處理文獻數據,幫助我們整理知識,可以大幅提升計算模擬精度效率,提升實驗室效率。因此,基于AI4S帶來的工程體系變化,毫無疑問,學校里的科研和教學將會發生很大的改變。
未來,AI4S將會改變科研生產關系,從而將走向下一個AI4S時代。
“當前,行業正在從基礎能力的快速提升期逐步進入‘挖深礦’的深耕階段。”去年底,在界面新聞財經年會上,深勢科技藥物發現部聯席總裁王冬冬在接受界面新聞采訪時也提到,AI4S將進一步優化預測設計的精度和復雜度;在大數據驅動和知識圖譜輔助方面,解決現有數據不足和知識遷移問題,以及產業化與規模化所面臨的成本、算力、模型可解釋性等挑戰。