計算機科學學院成功上線“鑄牢中華民族共同體意識知識大模型” 積極推進人工智能有效賦能鑄牢工作
作者:張瀟 編輯:張瀟 上傳:祝夢歡 審核:柯尊韜 發(fā)布時間:2025-04-16 瀏覽次數(shù):
隨著DeepSeek,、ChatGPT,、Sora等人工智能大語言模型技術的迅速發(fā)展,,以馬克思主義民族觀,、社會主義核心價值觀為指導有效運用和駕馭人工智能大語言模型,,是當前和未來深入推進鑄牢中華民族共同體意識相關工作的大勢所趨,。目前,,在文化典籍數(shù)字化,、歷史檔案智能化等垂直領域已開始構建人工智能技術生態(tài),,但在鑄牢中華民族共同體意識領域尚未形成專精化大模型,。
我校計算機科學學院張瀟團隊敏銳捕捉新時代技術變革的趨勢,積極推進中華民族共同體學交叉學科建設,,創(chuàng)新性地將人工智能技術與民族事務治理深度融合,,成功上線“鑄牢中華民族共同體意識知識大模型”,探索出一條服務國家戰(zhàn)略需求,、有效鑄牢中華民族共同體意識的新路徑,。
張瀟團隊構建了民族工作領域首個大模型訓練自有語料庫。該語料庫以黨的民族理論政策,、《中華民族共同體概論》教材,、三交史等為養(yǎng)料(1324.4萬字),輔以涉民族領域法規(guī)數(shù)據(jù)庫,、相關學術論文(4411.1萬字),。此外,從中央網(wǎng)站,、民委網(wǎng)站,、地方網(wǎng)站、黨校(行政學院)系統(tǒng),、社科院系統(tǒng),、國家高端智庫、全國重點馬克思主義學院等獲取約4000萬字語料以及1萬道問答對,。形成了民族工作領域大模型建設的正能量內(nèi)容供給,,從底層邏輯上有效解決了大模型價值觀引導等問題。依托該自有語料庫,,通過對基于Transformer架構的千億級別基礎模型Qwen2—7B—base進行增量預訓練,、指令微調(diào)和檢索增強生成,打造面向中華民族共同體意識理解與價值觀對齊的大語言知識模型,,并基于強大的自然語言生成能力,,實現(xiàn)對中華民族共同體學領域知識體系的精準理解,。
目前,該模型已具備以下功能:一是支持互動式問答,,可幫助用戶深入了解中華民族多元一體的歷史事件,、文化習俗、傳統(tǒng)藝術等知識,;二是快速定位中華民族共同體學領域的研究成果,支持知識圖譜構建,;三是為《中華民族共同體概論》等相關課程提供教學資源動態(tài)更新,,以及民族學文獻、口述史,、非遺影像等資源的智能化采集與增量式擴充等多項支持,;四是幫助用戶解析國家民族政策,分析全國民族團結(jié)進步典型案例,,提煉可推廣的經(jīng)驗模式,。
下一步,張瀟團隊將繼續(xù)整合相關領域研究優(yōu)勢資源,,分階段推進“鑄牢”大模型系統(tǒng)完善,。一是加強基礎資源建設、二是加大核心技術研發(fā),、三是深化應用拓展,,同步推進“鑄牢”大模型在教育、科研,、政策等領域的示范應用,。
圖 :“鑄牢中華民族共同體意識知識大模型”登錄界面