【摘 要】 多種安全運營(yíng)產(chǎn)品被應用在本地或云端,傳統的安全檢測方式在大數據和云計算的環(huán)境中逐漸顯露出局限性,基于行為分析的安全檢測方法迅速發(fā)展,但仍存在誤報率高、缺乏上下文關(guān)聯(lián)、大量依靠人工評判等缺陷。本文針對上述問(wèn)題提出了一種利用外部知識庫、自身安全數據和智能算法深度結合的威脅識別、評價(jià)體系。該體系融合了高速發(fā)展的知識圖譜有關(guān)技術(shù)和圖神經(jīng)網(wǎng)絡(luò )技術(shù),兼具實(shí)用性和創(chuàng )新性。
【關(guān)鍵詞】 威脅知識庫 知識圖譜 圖神經(jīng)網(wǎng)絡(luò ) 風(fēng)險評估
1 引言
目前,安全信息事件管理(SIEM)系統、用戶(hù)實(shí)體行為分析(UEBA)系統,以及擴展檢測和響應(XDR)系統被越來(lái)越多的組織應用在本地或云端。大量實(shí)踐表明,基于行為分析的安全檢測方法在大數據和與云計算環(huán)境中越來(lái)越有優(yōu)勢。隨之而來(lái)產(chǎn)生了一系列重要問(wèn)題:行為的異常就等于安全威脅嗎?海量日志中的威脅如何檢測?識別出攻擊行為風(fēng)險級別如何評判?
由于缺乏對異常行為的進(jìn)一步研判、潛在威脅的挖掘、合理的威脅攻擊評判方式,造成了現有安全產(chǎn)品棘手的通病誤報率高、結果缺乏上下文邏輯關(guān)聯(lián)、分析大量依靠人工。這些問(wèn)題會(huì )嚴重影響用戶(hù)的實(shí)際體驗,大幅降低安全系統的可用性,并增加組織安全運營(yíng)中心(SOC)安全人員的工作負擔。如何提高安全系統的報警準確率,已經(jīng)成為行為分析關(guān)聯(lián)安全檢測系統迫切需要解決的問(wèn)題,一般的解決方法包括以下3種。
(1)行為基線(xiàn)調整:采用動(dòng)態(tài)行為基線(xiàn),根據用戶(hù)和實(shí)體近期行為數據對其基線(xiàn)定期更新。
(2)關(guān)聯(lián)分析結合專(zhuān)家人工研判:根據預先設定好的規則,關(guān)聯(lián)安全事件信息,輔助安全專(zhuān)家人工分析,對系統產(chǎn)生的異常行為進(jìn)行研判。
(3)風(fēng)險打分排序:對異常行為進(jìn)行風(fēng)險評估,累加其風(fēng)險評分并進(jìn)行排序,分析人員優(yōu)先關(guān)注排名較高的用戶(hù)或實(shí)體行為。
上述方法雖然在一定程度上緩解了誤報率高、結果缺乏上下文邏輯關(guān)聯(lián)、過(guò)度依靠人工等問(wèn)題,但都只是在某一維度上的片面優(yōu)化或是以犧牲系統邏輯性、實(shí)時(shí)性等性能為代價(jià)的。
本文提出了一種利用外部知識庫、自身安全數據和智能算法深度結合的威脅識別、評價(jià)體系,解決誤報率高、人工分析成本高且及時(shí)性差、風(fēng)險評估缺乏聯(lián)動(dòng)等關(guān)鍵問(wèn)題。利用本文研究的體系可采用多種智能算法,助力網(wǎng)絡(luò )安全智能化。
2 研究?jì)热莺蛢r(jià)值
2.1 研究?jì)热?/strong>
本文對網(wǎng)絡(luò )安全智能化技術(shù)深入研究,首先根據對抗戰術(shù)技術(shù)通用知識庫(ATT&CK)、結構化威脅信息表達(STIX)等多種安全知識框架,研究用于威脅檢測和攻擊鏈識別的知識庫,即威脅知識庫。其中包括威脅攻擊基本映射策略、威脅攻擊場(chǎng)景與模式。在威脅知識庫的輔助下研究網(wǎng)絡(luò )安全智能化實(shí)踐,探索基于圖神經(jīng)網(wǎng)絡(luò )技術(shù)的威脅攻擊鏈智能識別;有機結合威脅模式、攻擊事件研究并設計風(fēng)險場(chǎng)景,構造用于風(fēng)險評估分析的風(fēng)險因素模型,利用蒙特卡洛或其他隨機方法進(jìn)行評估計算。
2.1.1 威脅知識庫
威脅知識庫中包含基于安全知識框架的映射策略和威脅攻擊模式,如圖1所示。通過(guò)對ATT&CK安全知識框架中網(wǎng)絡(luò )攻擊技戰術(shù)的研究,基于用戶(hù)和實(shí)體行為構建關(guān)聯(lián)的“行為到攻擊技戰法(TTP)”的映射關(guān)系。將ATT&CK安全知識框架引入并應用到多種產(chǎn)品威脅識別、威脅情報方面,歸納基于A(yíng)TT&CK安全知識框架的映射策略:
(1)內部威脅與ATT&CK安全知識框架映射策略;
(2)外部威脅與ATT&CK安全知識框架映射策略。
通過(guò)對現有威脅攻擊日志數據和多方威脅情報的分析,提煉出攻擊模式的本體模型:
(1)研究關(guān)聯(lián)多方日志數據歸一化,同時(shí)分析日志中與本體模式對應成分,形成語(yǔ)義連貫、符合邏輯的攻擊示例;
(2)從眾多攻擊示例中提取關(guān)鍵攻擊步驟與威脅上下文,形成譜圖化攻擊模式和威脅場(chǎng)景。
圖1 威脅知識庫的作用
2.1.2 威脅智能化識別
利用專(zhuān)家預置的威脅攻擊鏈模式,實(shí)現基于知識圖譜和圖神經(jīng)網(wǎng)絡(luò )技術(shù)的威脅攻擊鏈智能識別,重點(diǎn)研究?jì)热萑缦拢?/p>
(1)基于威脅知識庫的本體模型構建,從多方日志中構建用戶(hù)知識圖譜,現有的日志多為結構化或半結構化,因此研究中采用知識融合的方式構建圖譜,并利用知識加工迭代完善圖譜數據內容;
(2)基于圖神經(jīng)網(wǎng)絡(luò )的子圖匹配技術(shù),采用已有帶標注數據訓練深度學(xué)習模型,訓練后的模型可智能識別威脅攻擊鏈。
2.1.3 風(fēng)險因素評估模型
多種威脅場(chǎng)景下多樣攻擊鏈會(huì )造成不同的損失和影響,評估威脅往往會(huì )消耗安全人員大量時(shí)間和精力,且人工評估包含較多的非量化的結論。為了有效管理風(fēng)險,需對風(fēng)險進(jìn)行量化評估。
根據對現有風(fēng)險因素模型和風(fēng)險評估方法的調研,本研究?jì)热莺痛鉀Q問(wèn)題包括以下3點(diǎn)。
(1)構建適用于本研究的信息系統風(fēng)險因子的分類(lèi)法與本體模型。參考常用的標準,如《ISO 31000:2018 風(fēng)險管理指南》,《美國標準技術(shù)研究院特別出版物 800-37》,《OpenFAIR風(fēng)險分類(lèi)學(xué)》[7]等。
(2)設置風(fēng)險場(chǎng)景。研究?jì)热葜饕獮槔猛{場(chǎng)景、攻擊鏈和風(fēng)險因子本體模型,識別風(fēng)險場(chǎng)景。從現有資產(chǎn)的主要利益相關(guān)者視角出發(fā),研究并設計包含威脅事件和攻擊行為的風(fēng)險場(chǎng)景,場(chǎng)景的關(guān)注點(diǎn)落在損失和影響。
(3)明確基于統計和隨機方法的風(fēng)險分析方法論和流程。研究在給定風(fēng)險因子本體模型和風(fēng)險場(chǎng)景后,通用的風(fēng)險分析評估流程包括場(chǎng)景和風(fēng)險因素分解、風(fēng)險因素評價(jià)策略、基于隨機方法的量化估算、緩解措施(控制項)評價(jià)等一系列步驟。
2.2 研究?jì)r(jià)值
本文研究如何利用ATT&CK安全框架,挖掘數據中的威脅線(xiàn)索,對抗愈發(fā)隱匿和嚴重的內外部威脅行為,達到持續降低組織的數字化運營(yíng)風(fēng)險的目的。
目前,雖然在諸多威脅感知場(chǎng)景下,學(xué)界和產(chǎn)業(yè)界利用統計機器學(xué)習的威脅分析方法取得了重要的突破,但在面對高度動(dòng)態(tài)復雜的網(wǎng)絡(luò )行為分析時(shí),感知層輸入往往缺乏有安全語(yǔ)義的規范化建模,數據層異常而非真實(shí)惡意攻擊的誤報情況難以避免。此外,多維度單點(diǎn)的感知分析結果,仍需要專(zhuān)家深度參與研判與關(guān)聯(lián)分析,才能完整還原攻擊行為全貌,限制了高級持續攻擊(APT)、內部威脅等高級復雜攻擊技戰術(shù)的分析自動(dòng)化水平的提升。本研究通過(guò)構建威脅知識圖譜,將語(yǔ)義孤立的多元異構信息聯(lián)系起來(lái),并利用圖神經(jīng)網(wǎng)絡(luò )嵌入技術(shù)發(fā)現海量日志中的潛在攻擊鏈。
攻擊鏈的識別可為安全人員提供重點(diǎn)關(guān)注對象和相關(guān)上下文信息,同一類(lèi)型場(chǎng)景下的不同攻擊鏈和不同場(chǎng)景下的相似攻擊鏈都需要評估,以便優(yōu)先處理更加緊急的安全事件。本研究提出風(fēng)險因素模型,即選取定義一致的風(fēng)險詞匯表及各風(fēng)險因子的關(guān)系,可以幫助組織的安全人員進(jìn)行威脅處理優(yōu)先級排序、后續運維和風(fēng)險管理工作,并有效地向決策層傳遞和對比風(fēng)險評估結果。
3 研究方案與說(shuō)明
本研究利用ATT&CK安全框架中的戰術(shù)、技術(shù)等方面的知識庫對異常行為進(jìn)行研判,并使用深度學(xué)習和機器學(xué)習等多種手段檢測并擴充威脅攻擊行為,最后通過(guò)風(fēng)險因素模型給予量化評估,最終達到對威脅識別、評判的目的。大體流程如下:
(1)將安全系統產(chǎn)生的異常、警報與ATT&CK安全框架中的戰術(shù)、技術(shù)進(jìn)行映射匹配,對系統所產(chǎn)生的異常和警報作進(jìn)一步研判,緩解安全系統高誤報率的問(wèn)題;
(2)通過(guò)時(shí)間維度審視被關(guān)注對象的所有離散行為、結合每個(gè)離散的異常行為與ATT&CK安全框架中的技戰術(shù)的映射匹配情況,以及相關(guān)聯(lián)的一系列連續上下文行為,識別威脅攻擊鏈,調查隱藏在異常和警報背后的安全威脅;
(3)根據風(fēng)險因素模型和風(fēng)險評估算法,量化威脅攻擊鏈帶來(lái)的影響,以便安全人員優(yōu)先處理高優(yōu)先級事件。
首先使用威脅知識庫把異常行為映射到ATT&CK安全框架中的戰術(shù)、技術(shù),安全人員可以從海量異常報警中進(jìn)一步識別出真正的安全威脅,顯著(zhù)降低安全系統的誤報率,如圖2所示。但是,網(wǎng)絡(luò )攻擊往往是一系列行為組成的,只判斷離散的惡意行為并不能真正阻止攻擊者,從根本上消除安全威脅。為了更好地應對網(wǎng)絡(luò )攻擊,實(shí)現對安全威脅由檢測分析、編排響應到取證溯源的全生命周期的管控,需要結合多種安全框架建立威脅攻擊鏈模型,并在其基礎上利用人工智能、知識圖譜與知識推理的關(guān)聯(lián)技術(shù),擴展當前威脅知識庫。
圖2 異常行為到ATT&CK安全框架的映射
建立威脅知識庫之后,無(wú)法利用其中知識直接識別日志中的攻擊鏈,需要利用數據融合、實(shí)體對齊、知識推理、質(zhì)量評估等技術(shù)把多方安全日志轉換為用戶(hù)行為圖譜。該圖譜作為本體模式指導下的數據層,與知識庫中威脅攻擊模式進(jìn)行匹配,用于探查攻擊者的攻擊技術(shù)和過(guò)程。
在用戶(hù)和實(shí)體的一系列時(shí)序行為中查找隱藏威脅攻擊鏈,難點(diǎn)在于行為中混合了正常行為和異常行為,很難將其與一系列的攻擊鏈模式、模型完全精確地匹配。所以采用近似求解的子圖匹配方法更為合適,如基于深度學(xué)習的一系列圖嵌入算法和圖匹配算法,包括圖神經(jīng)網(wǎng)絡(luò )(GNN)嵌入模型、圖卷積網(wǎng)絡(luò )(GCN)嵌入模型、子圖匹配網(wǎng)絡(luò )模型等,可以將圖譜中的節點(diǎn)連同語(yǔ)義信息一同轉換到低維的向量空間,并通過(guò)多種相似度學(xué)習算法達成攻擊鏈的智能學(xué)習,如圖3所示。
圖3 基于圖神經(jīng)網(wǎng)絡(luò )的子圖匹配方案(NTN:神經(jīng)張量網(wǎng)絡(luò );ATT:注意力矩陣;conv:卷積)
最后,通過(guò)建立風(fēng)險因素模型并評估威脅攻擊鏈,達到威脅優(yōu)先級排序的目的:
(1)識別風(fēng)險場(chǎng)景,在其內定義并描述資產(chǎn)、威脅、控制項、影響/損失等;
(2)設計明確定義的風(fēng)險因素分類(lèi)法,如圖4所示,該步驟可以使風(fēng)險評估信息有效地傳遞、對比并輸出報告,具體可參考知名機構所出版的標準;
(3)構建風(fēng)險因素模型,該模型利用上一步定義風(fēng)險因素分類(lèi)法,設置一系列風(fēng)險因素和子因素;為了提升評估精度,研究中選取不同子因素聚合到上級風(fēng)險因素的函數,聚合函數會(huì )采用概率分布、鏈式聚合、層級聚合等多種形式;
(4)測量并對風(fēng)險因素估值,研究中采用蒙特卡洛或其他隨機方法;利用統計的原理進(jìn)行輔助分析的技術(shù)還需在實(shí)驗中進(jìn)一步選型。
圖4 風(fēng)險因素分類(lèi)法示例
4研究特色與創(chuàng )新點(diǎn)
4.1 威脅知識庫的特色與優(yōu)勢
本研究所構建的威脅知識庫具有以下4個(gè)方面的特色與優(yōu)勢。
(1)成熟的安全框架理念:將ATT&CK安全框架應用于威脅檢測、分析及響應。
(2)威脅輔助分析與智能識別:把異常行為與ATT&CK安全知識框架中的技戰術(shù)進(jìn)行匹配映射,精準識別威脅,并利用ATT&CK安全框架中的知識輔助分析。關(guān)聯(lián)各個(gè)異常行為,挖掘隱藏在其背后的完整攻擊意圖,并利用人工智能領(lǐng)域的相關(guān)算法,智能識別安全威脅攻擊鏈。
(3)降低誤報率:與傳統威脅檢測系統相比,基于A(yíng)TT&CK安全知識庫中的技戰法(TTP)對系統異常和警報進(jìn)行映射,可大幅度降低系統異常行為報警的誤報率。
(4)已有經(jīng)驗知識再利用:預置各種攻擊鏈模式、模型,智能化匹配識別系統行為數據中隱藏的威脅攻擊鏈,挖掘攻擊者的真正攻擊意圖。
4.2 圖神經(jīng)網(wǎng)絡(luò )的子圖匹配算法特色與優(yōu)勢
圖神經(jīng)網(wǎng)絡(luò )的子圖匹配算法特色與優(yōu)勢主要體現在以下2個(gè)方面。
(1)結合新知識、新理念、新技術(shù):構造以日志數據為基礎,引入專(zhuān)家知識的本體模型;將用戶(hù)行為與威脅攻擊模式圖(譜)化,再利用基于圖神經(jīng)網(wǎng)絡(luò )子圖匹配技術(shù),把復雜多樣攻擊鏈識別過(guò)程轉化為深度學(xué)習過(guò)程。
(2)節點(diǎn)特征向量嵌入不同抽象層級的特征空間:通過(guò)把日志數據和威脅模型中部分實(shí)體映射到更高抽象層級的ATT&CK威脅框架內,可給圖譜中節點(diǎn)的特征向量提供額外維度且不同抽象層級的信息,結合日志中已有的實(shí)體特征信息,可加速節點(diǎn)匹配過(guò)程,提升子圖匹配模型的性能和匹配成功率。
4.3 風(fēng)險因素模型特色和創(chuàng )新
本研究所采用的風(fēng)險因素模型具有以下2個(gè)方面的特色和創(chuàng )新。
(1)從風(fēng)險的角度度量攻擊事件和行為:威脅與攻擊鏈識別從網(wǎng)絡(luò )空間安全的角度出發(fā),注重攻擊者的行為序列及攻擊產(chǎn)生的前因后果。而風(fēng)險因素模型從風(fēng)險管理的角度考慮多種安全域和控制項,結合威脅頻率、攻擊強度、資產(chǎn)損失等因素綜合且全面評價(jià)攻擊事件,把攻擊知識領(lǐng)域和風(fēng)險管理領(lǐng)域有機結合。
(2)采用概率和統計結合的量化評估流程:建立風(fēng)險因素關(guān)聯(lián)的概率模型,再結合攻擊鏈識別技術(shù),風(fēng)險因素模型由靜態(tài)轉為動(dòng)態(tài),不但可根據實(shí)際識別結果有效區分高頻低損失威脅和低頻高損失威脅,還可根據實(shí)際業(yè)務(wù)集成于多種風(fēng)險場(chǎng)景中。研究采用蒙特卡洛模擬算法模擬統計分析過(guò)程,可解決因子關(guān)聯(lián)的復雜概率模型抽樣困難的問(wèn)題。
5 結語(yǔ)
利用基于A(yíng)TT&CK和STIX安全框架構建威脅知識庫可以在很大程度上提升各類(lèi)基于行為的安全系統的檢測精度,并且可以深入挖掘隱藏在一連串異常行為背后的威脅攻擊鏈,從而分析攻擊者的真正意圖。威脅知識庫構建的難點(diǎn)在于如何更好地構建基于A(yíng)TT&CK安全框架的映射策略、識別威脅攻擊鏈這兩方面。對于映射策略而言,需要安全人員對ATT&CK安全框架具有較深入的理解,并且了解自身所掌握的數據和具體需求。根據實(shí)際使用效果不斷調整映射策略中不合理的映射關(guān)系。風(fēng)險因素模型對攻擊鏈的風(fēng)險評估,讓智能算法的應用更加可行。攻擊鏈可能造成風(fēng)險在不同場(chǎng)景中有很大不同,結合威脅場(chǎng)景、風(fēng)險因素模型,可有效度量攻擊鏈的風(fēng)險,幫助安全人員優(yōu)先響應重要事件。
(原載于《保密科學(xué)技術(shù)》雜志2023年1月刊)