2025年9月15日,在國家網絡安全宣傳周主論壇上,《人工智能安全治理框架》2.0版(以下簡稱《框架》2.0版)正式發(fā)布,這是2024年發(fā)布的《人工智能安全治理框架》1.0版(以下簡稱《框架》)的升級版本。針對人工智能迅猛發(fā)展帶來的治理難點,《框架》2.0版秉持我國一貫倡導的“以人為本、智能向善”的基本理念,強化風險識別精細化,增強框架動態(tài)適應能力并提升與國際規(guī)則銜接水平。這一新版本為我國人工智能安全治理提供更穩(wěn)固的治理框架支撐,為產業(yè)發(fā)展提供明確方向,也為全球治理貢獻系統化的中國方案,展現出重要的戰(zhàn)略價值。

一、《框架》2.0版出臺背景

隨著全球人工智能技術發(fā)展進入加速期,技術創(chuàng)新與應用落地呈現出爆發(fā)式增長的態(tài)勢,2024年全球人工智能市場規(guī)模已經超過2792億美元,預計到2030年年復合增長率將會達到35.9%。然而技術的快速發(fā)展也帶來了前所未有的安全挑戰(zhàn)與治理難題,在技術層面,人工智能系統的脆弱性正日益凸顯,算法偏見問題導致的歧視現象在多個領域已經出現,模型可解釋性不足讓關鍵決策過程陷入“黑箱”困境,對抗性攻擊技術的出現使AI系統面臨新的安全威脅,從應用實踐方面來看人工智能安全事件呈現頻發(fā)的態(tài)勢。截至2025年4月全球已報告的深度偽造相關事件達179起,超出2024年全年總量,涉及數據泄露等多個方面,這些案件不僅侵犯了個人權益,更對社會穩(wěn)定和國家安全構成了威脅。2024年發(fā)布的《框架》在原則確立與基礎構建方面起到了重要作用,但在風險分類精細度、治理措施操作性以及國際規(guī)則兼容性等方面有待細化。面對快速迭代的技術發(fā)展和日益復雜的安全威脅,迫切需要構建一個更加完善且更具前瞻性的治理體系。在這樣的背景下,國家相關部門組織專業(yè)力量,在深入開展調研和廣泛征求各方意見的基礎上制定《框架》2.0版,新框架充分吸收國內外最新研究成果與實踐經驗,針對當前人工智能發(fā)展所面臨的最緊迫安全問題提出系統性解決方案?!犊蚣堋?.0版的出臺既是對技術發(fā)展趨勢的及時回應之舉,也是完善國家治理體系的一項重要舉措,體現出統籌發(fā)展與安全的戰(zhàn)略思維,為人工智能產業(yè)健康有序發(fā)展提供了制度框架保障。

相較于2024年9月發(fā)布的《框架》,此次出臺的《框架》2.0版在形式上延續(xù)既有總體架構和邏輯體系,也在理念與措施方面作出實質性拓展?!犊蚣堋?.0版繼續(xù)保持風險識別、技術應對、綜合治理和安全指引的框架結構,沿用風險分類、可追溯管理等治理工具確保制度一致性和可操作性。在此基礎上《框架》2.0版進一步提出“可信應用、防范失控”新原則并構建人工智能科技倫理準則,新增應用衍生風險治理維度且強化開源與供應鏈安全機制,這些新增內容既回應技術演進帶來的新挑戰(zhàn),也讓治理目標從“能否實現”轉變?yōu)椤叭绾呜撠熑蔚貙崿F”。圍繞可信原則,《框架》2.0版將價值約束融入技術流程以確保技術發(fā)展可控可信,同時《框架》2.0版強調開源生態(tài)、供應鏈管理和國際接軌推動構建開放協同治理格局,這一轉變使“可信”從抽象原則轉化為制度化可執(zhí)行要求,既回應公眾對人工智能長期可靠和可控的期待,也為全球治理提供系統化的中國方案。

二、《框架》2.0版呈現全方位多層次保障機制

《框架》2.0版的發(fā)布意味著我國人工智能治理體系建設步入新階段,從整體情況來看,《框架》2.0版主要涵蓋安全治理原則與總體框架、安全風險分類、技術應對措施、綜合治理措施與安全指引等內容,不僅構建起較為完整的系統和治理體系,更關鍵的是為人工智能健康發(fā)展提供全方位多層次保障機制。

(一)作為系統性治理藍圖的框架全景

《框架》2.0版搭建起多層次全方位治理體系,該體系將安全治理原則與總體框架當作總綱,明確人工智能安全治理基本方向和核心要求??偩V部分以“以人為本、智能向善”作為導向,遵循包容審慎、敏捷治理、技管結合、開放合作、可信應用五大原則,既體現國際共識又結合中國國情,為整個治理體系提供價值導向和理論根基。《框架》2.0版設計14項綜合治理措施和4項安全指引,通過系統化設計實現從原則到實踐、從技術到管理的有機銜接,形成層次分明、相互支撐的治理藍圖,既考慮當前技術發(fā)展水平又為未來技術演進預留空間,充分體現框架的前瞻性和適應性。

(二)倫理先行治理作為價值紅線

《框架》2.0版提出構建人工智能科技倫理準則,首次把科技倫理治理系統納入人工智能安全治理整體框架,確立倫理先行核心原則為技術健康發(fā)展劃定價值紅線,人工智能治理不再局限于算法數據算力技術性監(jiān)管,而是將生命健康、人格尊嚴、勞動就業(yè)等關涉公共利益和社會底線要素重點保護。與《框架》偏重技術安全不同,《框架》2.0版實現從單純強調風險防護到技術與倫理并重深度轉型,推動人工智能治理進入更成熟階段,其所確立價值導向與治理路徑有效地提升了我國人工智能治理全面性和前瞻性,也在全球范圍提供了具有普遍意義的中國經驗,為人工智能倫理治理國際對話與規(guī)則塑造貢獻制度化的參考方案。

(三)可信可控原則成為安全基石

《框架》2.0版清晰明確地提出“可信應用、防范失控”核心原則,系統全面地構建涵蓋技術防護、價值對齊與協同治理多層次可信人工智能準則體系,其目的在于確保人工智能技術演進全過程實現安全、可靠與可控,特別關注防范可能威脅人類生存與發(fā)展全局性失控風險。通過強化模型魯棒性、對抗性防御和安全驗證等技術保障措施,積極推進人工智能系統與人類意圖和價值規(guī)范實現深度對齊,同時建立健全跨部門、跨領域協同治理有效機制,最終形成可操作、可審查、可干預的治理閉環(huán),以此確保人工智能在任何階段都處于人類有效控制范圍之內。這一原則的提出以及有效落實,不僅體現中國對人工智能極端風險具有前瞻性應對舉措,也為全球人工智能治理提供風險防控與可持續(xù)發(fā)展并重的重要實踐范式。

(四)新增“人工智能應用衍生安全風險”

《框架》2.0版對人工智能風險的認識提升到新高度。在風險分類方面,此次《框架》2.0版保留原有《框架》內生安全風險和應用安全風險后,新增“人工智能應用衍生安全風險”,聚焦技術應用環(huán)節(jié)且將人工智能可能帶來的深層次社會影響納入治理視野,這一新增維度體現治理視角的拓展與深化,重點包含社會和環(huán)境層面的系統沖擊以及倫理秩序層面的深遠影響。在社會和環(huán)境安全方面,《框架》2.0版重點關注人工智能應用對勞動就業(yè)結構與資源供需平衡的挑戰(zhàn),在倫理層面,不僅涵蓋算法偏見或數據泄露等影響個人合法權益的問題,更關注人工智能在長期運行中對社會結構、認知生態(tài)和公共秩序的潛在影響,比如技術對人類情感的擾動、智能體發(fā)展對教育創(chuàng)新的沖擊與抑制以及大規(guī)模技術應用對現行社會秩序和可持續(xù)發(fā)展的深遠影響。

三、《框架》2.0版的意義與展望

《框架》2.0版的發(fā)布在我國人工智能治理體系里有承前啟后的意義,其不僅延續(xù)《框架》所建立起來的基本治理框架,還在制度設計與治理理念方面實現深度擴展。在治理原則上,《框架》2.0版新增“可信應用、防范失控”核心治理原則,把人工智能安全性、可靠性和可控性當作治理底線,確保技術發(fā)展始終處在可預期、可管控的軌道之上,為研發(fā)與應用奠定更穩(wěn)固制度保障。在治理理念上,《框架》2.0版明確提出構建人工智能科技倫理準則,并且將“倫理先行”確立成為人工智能治理工作的核心導向,同時把生命健康、人格尊嚴、社會公平、生態(tài)環(huán)境和可持續(xù)發(fā)展等價值嵌入人工智能全生命周期治理當中,進而讓倫理審查從原本邊緣化的程序轉變成為常態(tài)化機制,最終真正實現人工智能技術與價值的深度耦合。在風險體系上,《框架》2.0版在原有內生安全風險和應用安全風險基礎之上新增應用衍生安全風險,將治理范圍從技術研發(fā)監(jiān)管與直接應用問題拓展到社會結構、環(huán)境資源和倫理秩序等更深層面,進而讓人工智能治理體系實現從短期防護向長期評估的轉型,從點狀應急走向全局統籌,凸顯制度設計整體性與前瞻性。

展望未來,《框架》2.0版的實施會推動我國人工智能治理進入制度化體系化國際化新階段,在國內層面它會加快人工智能安全標準體系的完善進程,推動研發(fā)應用和監(jiān)管全鏈條的制度能夠順利落地,并且催生合規(guī)審查風險評估倫理咨詢等新興服務產業(yè),形成技術創(chuàng)新與制度供給協同發(fā)展的良好格局。同時《框架》2.0版提出的“可信”原則會逐步內化為產業(yè)發(fā)展核心要求,倒逼企業(yè)在技術設計中注重透明性可解釋性和責任可追溯性,從而在保障安全與倫理的前提之下推動產業(yè)高質量可持續(xù)發(fā)展。

在國際層面上,《框架》2.0版著重強調開放合作與共治共享,既回應了全球人工智能治理方面的現實需求,也為國際規(guī)則競爭提供了相應的制度抓手。隨著人工智能于全球范圍內得到廣泛應用,中國在風險治理、倫理準則以及制度創(chuàng)新方面的實踐經驗,將為國際社會提供可復制的參考路徑。可以預見的是,未來的人工智能治理競爭不只是技術和資本的競爭,更是制度與價值層面的競爭,《框架》2.0版的發(fā)布,不僅為中國在全球可信人工智能競賽里確立制度優(yōu)勢奠定了堅實的基礎,也為推動人工智能更好服務人類福祉和可持續(xù)發(fā)展指明了前進的方向。(作者:張平,北京大學法學院教授,北京大學人工智能研究院AI安全與治理中心主任,北京大學武漢人工智能研究院副院長)