2025年9月15日,在2025年國家網(wǎng)絡(luò)安全宣傳周主論壇上,《人工智能安全治理框架》2.0版(以下簡稱《框架》2.0版)正式發(fā)布。這是繼2024年9月發(fā)布《人工智能安全治理框架》1.0版(以下簡稱《框架》)后的又一重大制度性成果,體現(xiàn)了我國在人工智能安全治理領(lǐng)域持續(xù)深化、與時俱進的戰(zhàn)略布局?!犊蚣堋?.0版在前一版本的基礎(chǔ)上,梳理調(diào)整了風(fēng)險分類,探索提出分級治理原則,強化全生命周期技術(shù)治理手段,標志著我國人工智能治理理念從“初步確立”邁向“體系升級”,為推動人工智能在安全可控前提下健康發(fā)展提供了制度保障和戰(zhàn)略引領(lǐng)。

一、細化風(fēng)險分類:風(fēng)險體系的升級與調(diào)整

在風(fēng)險體系上,《人工智能安全治理框架》1.0版將人工智能安全風(fēng)險分為“內(nèi)生安全風(fēng)險”和“應(yīng)用安全風(fēng)險”兩大類,主要聚焦算法、數(shù)據(jù)、系統(tǒng)本身以及在應(yīng)用中可能引發(fā)的現(xiàn)實、網(wǎng)絡(luò)、認知與倫理問題。而《框架》2.0版則對風(fēng)險分類進行了系統(tǒng)優(yōu)化,將安全風(fēng)險細化為三類:技術(shù)內(nèi)生安全風(fēng)險、技術(shù)應(yīng)用安全風(fēng)險和應(yīng)用衍生安全風(fēng)險。其中,技術(shù)內(nèi)生安全風(fēng)險主要指算法模型、數(shù)據(jù)、系統(tǒng)等自身帶來的風(fēng)險,還特別增加了“模型開源風(fēng)險”,指出基礎(chǔ)模型開源可能被不法分子用于訓(xùn)練“作惡模型”;技術(shù)應(yīng)用安全風(fēng)險側(cè)重模型在具體應(yīng)用中的風(fēng)險,強調(diào)低質(zhì)有害信息經(jīng)網(wǎng)絡(luò)擴散會污染內(nèi)容生態(tài);應(yīng)用衍生安全風(fēng)險則明確指向人工智能應(yīng)用衍生出的社會層面風(fēng)險,如沖擊就業(yè)結(jié)構(gòu)、資源供需平衡、科研倫理風(fēng)險等,例如“AI+科研”可能降低高倫理風(fēng)險科研領(lǐng)域的準入門檻,引發(fā)違背社會倫理的研究行為等。這一調(diào)整體現(xiàn)了治理思路從“靜態(tài)治理”向“動態(tài)治理”的轉(zhuǎn)變,不僅關(guān)注技術(shù)本身的安全性,也兼顧其在復(fù)雜社會環(huán)境中的外溢效應(yīng)。

二、強化技術(shù)治理:構(gòu)建全生命周期安全能力

在技術(shù)治理方面,此次發(fā)布的《框架》2.0版引入了多項全新舉措,突出研發(fā)與應(yīng)用的全生命周期安全治理理念,特別指出要在人工智能系統(tǒng)的設(shè)計、開發(fā)、測試、部署、運維等各個環(huán)節(jié)全面嵌入安全考量。對比《框架》,《框架》2.0版明顯加大了對技術(shù)和工程措施的重視,體現(xiàn)了從技術(shù)到管理的協(xié)同框架。前者的技術(shù)應(yīng)對措施主要針對模型算法、訓(xùn)練數(shù)據(jù)、算力設(shè)施等提出靜態(tài)加固手段,而新版則更多強調(diào)持續(xù)演進與動態(tài)更新。例如,《框架》2.0版要求建立治理措施動態(tài)調(diào)整機制,應(yīng)對技術(shù)迭代帶來的不確定性;新增的“分級管理”也意味著根據(jù)不同風(fēng)險等級采取差異化的技術(shù)手段。

這些變化標志著我國的人工智能治理思路正在從“被動補救”向“主動駕馭”轉(zhuǎn)變,希望建立更敏捷、高動態(tài)的治理體系。同時,《框架》2.0版的技術(shù)治理更加側(cè)重早期介入、全環(huán)節(jié)覆蓋與靈活調(diào)整,與國際上推動可信AI和安全評估的趨勢更加契合。國內(nèi)科研機構(gòu)制定技術(shù)標準與評測體系,搭建了算法安全評估試驗場基礎(chǔ)設(shè)施,支撐從數(shù)據(jù)安全評估、模型設(shè)計與開發(fā)安全審計、算法運行時風(fēng)險監(jiān)測等貫穿全生命周期的智能算法安全評估,與《框架》2.0版重點強調(diào)的全生命周期安全治理不謀而合,也為框架的落地實施提供了可行的技術(shù)路徑支撐。

三、人才培養(yǎng)與共治共享:共建協(xié)同治理生態(tài)

此外,《框架》2.0版在人才培養(yǎng)方面和共治共享方面也有一些新表述和新觀點值得關(guān)注。

在人才培養(yǎng)方面,此前的《框架》曾提出“加大人工智能安全人才培養(yǎng)力度”,要求推動AI安全教育與學(xué)科同步發(fā)展、依托學(xué)校和科研機構(gòu)培養(yǎng)AI安全設(shè)計、開發(fā)和治理人才。新版本延續(xù)了這一思路,并倡導(dǎo)通過高校、企業(yè)與政府合作培養(yǎng)復(fù)合型安全人才。有國內(nèi)媒體就此評論:“《框架》2.0版發(fā)布后,需要與產(chǎn)業(yè)、學(xué)界共同落實人才培養(yǎng)計劃,形成產(chǎn)學(xué)研一體化的良性互動?!?/p>

在共治共享方面,新框架明確倡導(dǎo)多方協(xié)同和跨界治理。中央網(wǎng)信辦指出,《框架》2.0版將促進構(gòu)建“跨國界、跨領(lǐng)域、跨行業(yè)的協(xié)同治理格局”,推動國際多邊合作和技術(shù)成果共享。也就是說,《框架》2.0版不僅繼續(xù)強調(diào)國際規(guī)則和最佳實踐的共享,也突出不同部門、領(lǐng)域和國家之間的聯(lián)動機制。

這一升級體現(xiàn)出人工智能安全治理從“單點發(fā)力”向“體系聯(lián)動”的轉(zhuǎn)變:一方面,通過系統(tǒng)化的人才培養(yǎng)為治理體系提供長效支撐;另一方面,以多元主體的協(xié)同合作,形成法律、倫理與標準的共同約束力和執(zhí)行力。這不僅是我國對人工智能安全治理的深化布局,也是面向全球的制度性貢獻,有望推動形成廣泛的國際共識與合作機制。

總體來看,《框架》2.0版在風(fēng)險分類上實現(xiàn)了更為細化和全面的體系升級,在治理方式上體現(xiàn)出從被動向主動的范式轉(zhuǎn)變,在生態(tài)建設(shè)上凸顯了跨界協(xié)同和共治共享的戰(zhàn)略導(dǎo)向。這不僅為我國人工智能安全治理提供了制度性遵循,也為國際治理貢獻了具有中國特色的“中國方案”。(作者:程學(xué)旗,中國科學(xué)院計算技術(shù)研究所副所長、研究員)