7月28日,「諦聽」地震波大模型在四川成都發(fā)布,該大模型由國家超級計算成都中心、中國地震局地球物理研究所以及清華大學聯(lián)合開發(fā),是首個億級參數(shù)量的地震波大模型。
成都超算中心運營管理有限公司董事長郭黎介紹,2023年9月,國家超級計算成都中心與中國地震局地球物理研究所合作共建了「地震大模型創(chuàng)新應用聯(lián)合實驗室」,與清華大學、中國科學院地質(zhì)與地球物理研究所合作啟動了「諦聽」地震波大模型的訓練。「諦聽」數(shù)據(jù)集是國內(nèi)首個,也是目前國內(nèi)外最大規(guī)模、樣本類型和標註最為全面的地震學專業(yè)AI訓練數(shù)據(jù)集之一,半年多時間裏,實驗室研究人員利用「諦聽」數(shù)據(jù)集獲得了首個億級參數(shù)量的地震波大模型。
「長期來看,地震學是一門觀測科學,重大突破往往來自對觀測數(shù)據(jù)的深刻理解。」中國地震局地球物理研究所副所長陳石介紹,目前,傳統(tǒng)方法和中小模型均無法充分利用百TB、千TB級別的地震觀測數(shù)據(jù),而這些數(shù)據(jù)對地震學研究有重要意義,只有通過大模型才能深入挖掘。
「『諦聽』大模型依托海量數(shù)據(jù),通過先進的人工智能技術(shù),已經(jīng)顯著提升了地震信號的識別準確率和速度。」陳石說。
國家超算成都中心常務副主任王建波介紹,「諦聽」地震波大模型對於突破中小地震波模型性能瓶頸,提高地震大數(shù)據(jù)智能處理能力和信息挖掘水平具有重要意義,國家超算成都中心正不斷加速人工智能技術(shù)在防災減災、智慧城市等領域的應用與發(fā)展。據(jù)了解,目前「諦聽」地震波大模型已可投入使用,十億參數(shù)量級的版本預計2024年8月完成預訓練。未來,該大模型還可用於礦震監(jiān)測、城市地下空間結(jié)構(gòu)探測、海底地震監(jiān)測等多個領域。(圖為資料圖)