使用人工智能發(fā)現(xiàn)和保護(hù)敏感數(shù)據(jù)

數(shù)據(jù)是現(xiàn)代企業(yè)的新石油:正確使用它可以促進(jìn)公司的發(fā)展并幫助企業(yè)在競爭中領(lǐng)先。就像石油一樣,原始數(shù)據(jù)和未被發(fā)現(xiàn)的數(shù)據(jù)是毫無用處的,企業(yè)將無法從中受益;在最壞的情況下,它可能會(huì)導(dǎo)致安全事件。這也是企業(yè)投資敏感數(shù)據(jù)發(fā)現(xiàn)和保護(hù)解決方案的原因。

本文來自微信公眾號(hào)“嘶吼專業(yè)版”,作者/山卡拉。

數(shù)據(jù)是現(xiàn)代企業(yè)的新石油:正確使用它可以促進(jìn)公司的發(fā)展并幫助企業(yè)在競爭中領(lǐng)先。就像石油一樣,原始數(shù)據(jù)和未被發(fā)現(xiàn)的數(shù)據(jù)是毫無用處的,企業(yè)將無法從中受益;在最壞的情況下,它可能會(huì)導(dǎo)致安全事件。這也是企業(yè)投資敏感數(shù)據(jù)發(fā)現(xiàn)和保護(hù)解決方案的原因。

傳統(tǒng)的數(shù)據(jù)發(fā)現(xiàn)工具由數(shù)據(jù)掃描儀和基于規(guī)則的算法提供支持,這些工具通常不足以掌握不斷增長的新數(shù)據(jù)流。因此,許多企業(yè)利用人工智能(AI)增強(qiáng)其數(shù)據(jù)發(fā)現(xiàn)和保護(hù)解決方案。

在本文中,我們將討論基于規(guī)則系統(tǒng)的主要缺點(diǎn)以及使用人工智能發(fā)現(xiàn)和保護(hù)敏感數(shù)據(jù)的好處、典型的數(shù)據(jù)發(fā)現(xiàn)和保護(hù)解決方案的工作原理,還分享有Apriorit經(jīng)驗(yàn)中的開發(fā)技巧。

敏感數(shù)據(jù)發(fā)現(xiàn)如何影響企業(yè)安全

將敏感數(shù)據(jù)保存在一個(gè)安全的存儲(chǔ)位置似乎是一項(xiàng)容易的任務(wù),但實(shí)際上對(duì)于許多企業(yè)來說幾乎是不可能的。在COVID-19大流行期間過渡到遠(yuǎn)程或混合工作、將本地環(huán)境遷移到云或經(jīng)歷合并和收購過程,可能會(huì)導(dǎo)致敏感數(shù)據(jù)存儲(chǔ)在最不明顯的地方。此類數(shù)據(jù)會(huì)受到網(wǎng)絡(luò)安全解決方案的關(guān)注,并增加數(shù)據(jù)泄露或安全事件的風(fēng)險(xiǎn)。

存儲(chǔ)在企業(yè)控制和安全邊界之外的數(shù)據(jù)會(huì)帶來數(shù)據(jù)盜竊或數(shù)據(jù)泄漏等安全事件的風(fēng)險(xiǎn)。這就是企業(yè)投資敏感數(shù)據(jù)發(fā)現(xiàn)軟件的原因——用于檢測、識(shí)別和組織所有組織資源和環(huán)境中的記錄的工具。

實(shí)施這樣的解決方案可以讓企業(yè):

·確保遵守網(wǎng)絡(luò)安全法

·防止數(shù)據(jù)被盜和泄露

·進(jìn)行數(shù)據(jù)驅(qū)動(dòng)的網(wǎng)絡(luò)安全改進(jìn)

·提高數(shù)據(jù)管理效率

640 (1).png

跨不同環(huán)境和基礎(chǔ)設(shè)施控制敏感數(shù)據(jù)的需求不斷增長,導(dǎo)致數(shù)據(jù)發(fā)現(xiàn)軟件越來越受歡迎。事實(shí)上,全球敏感數(shù)據(jù)發(fā)現(xiàn)市場預(yù)計(jì)將從2020年的51億美元增長到2026年的124億美元。

敏感數(shù)據(jù)保護(hù)發(fā)現(xiàn)和工具對(duì)于以下行業(yè)中處理敏感信息的企業(yè)尤其重要:

·金融科技

·零售與電子商務(wù)

·衛(wèi)生保健

·保險(xiǎn)

·運(yùn)輸與物流

·人力資源和客戶服務(wù)

·軟件開發(fā)

然而,傳統(tǒng)的數(shù)據(jù)發(fā)現(xiàn)解決方案無法始終跟上現(xiàn)代公司生成新記錄的速度。接下來,我們來看看這些工具的主要弱點(diǎn)和局限性。

為什么傳統(tǒng)的數(shù)據(jù)發(fā)現(xiàn)工具不夠用

雖然用于數(shù)據(jù)發(fā)現(xiàn)和保護(hù)的專用工具可提供許多業(yè)務(wù)優(yōu)勢,但管理它們并將其集成到現(xiàn)有的公司系統(tǒng)中可能具有挑戰(zhàn)性。

以下是基于規(guī)則的數(shù)據(jù)發(fā)現(xiàn)的主要缺點(diǎn):

640 (1).png

1.發(fā)現(xiàn)過程緩慢

基于規(guī)則的系統(tǒng)通常依賴數(shù)據(jù)庫和存儲(chǔ)掃描器來發(fā)現(xiàn)新記錄。他們花費(fèi)大量時(shí)間來分析集成的存儲(chǔ)實(shí)例,必須進(jìn)行一一掃描。如果在掃描期間添加新記錄,該工具將不會(huì)發(fā)現(xiàn)它,直到完成當(dāng)前掃描并開始新掃描。此外,掃描儀必須在每次掃描期間檢查所有記錄,包括自上次掃描以來未更改的記錄。

2.非結(jié)構(gòu)化記錄的發(fā)現(xiàn)能力較差

基于規(guī)則的工具可以輕松發(fā)現(xiàn)數(shù)據(jù)庫、日志和電子表格等結(jié)構(gòu)化數(shù)據(jù)源中的敏感記錄。當(dāng)涉及非結(jié)構(gòu)化數(shù)據(jù)源(電子郵件、文本文檔、社交媒體)時(shí),發(fā)現(xiàn)的準(zhǔn)確性會(huì)顯著下降,因?yàn)榉墙Y(jié)構(gòu)化記錄分散且不一致。使用非AI解決方案掃描此類數(shù)據(jù)源通常會(huì)提供不可靠且不完整的結(jié)果,考慮到企業(yè)生成的約90%的數(shù)據(jù)是非結(jié)構(gòu)化的,這一點(diǎn)尤其重要。

3.需要大量的手動(dòng)輸入

為了成功使用基于規(guī)則的系統(tǒng),企業(yè)必須執(zhí)行大量手動(dòng)活動(dòng):設(shè)置配置、指定掃描和分類規(guī)則以及正則表達(dá)式、查看結(jié)果等等。大量手動(dòng)輸入會(huì)增加引入人為錯(cuò)誤的機(jī)會(huì)。使用基于規(guī)則的系統(tǒng)也不能消除手動(dòng)發(fā)現(xiàn)系統(tǒng)無法識(shí)別的數(shù)據(jù)(例如上面討論的非結(jié)構(gòu)化記錄)的需要。

4.分類保護(hù)錯(cuò)誤

當(dāng)數(shù)據(jù)沒有被正確、完整地發(fā)現(xiàn)時(shí),任何工具都很難對(duì)其進(jìn)行分類:確定敏感記錄的類型、計(jì)算風(fēng)險(xiǎn)評(píng)分并分配所需的網(wǎng)絡(luò)安全措施。敏感數(shù)據(jù)分類不正確可能會(huì)使記錄不受保護(hù),從而導(dǎo)致數(shù)據(jù)被盜和合規(guī)違規(guī)。

5.缺乏網(wǎng)絡(luò)安全背景

基于規(guī)則的系統(tǒng)收集有關(guān)數(shù)據(jù)發(fā)現(xiàn)的有限數(shù)據(jù)。通常,它們受到發(fā)現(xiàn)的數(shù)據(jù)類型及其位置的限制。為了檢查工具的發(fā)現(xiàn)和分類性能,網(wǎng)絡(luò)安全專家必須手動(dòng)評(píng)估新記錄并收集缺失的上下文,然后才能做出最終決定。

這些限制源于基于規(guī)則的系統(tǒng)的核心算法,這就是為什么即使是經(jīng)驗(yàn)豐富的開發(fā)人員和系統(tǒng)管理員也難以克服它們。對(duì)于存儲(chǔ)空間相對(duì)較小、每天不會(huì)創(chuàng)建大量數(shù)據(jù)并且擁有可用IT資源來管理發(fā)現(xiàn)過程的組織來說,使用此類系統(tǒng)是有益的。

如果有嚴(yán)格的網(wǎng)絡(luò)安全要求,并且需要更多背景信息來發(fā)現(xiàn)和保護(hù)數(shù)據(jù),請考慮選擇基于人工智能的工具。采用強(qiáng)大的基于人工智能的系統(tǒng)可以滿足敏感數(shù)據(jù)保護(hù)和網(wǎng)絡(luò)安全合規(guī)性方面的許多業(yè)務(wù)需求。

為什么使用人工智能進(jìn)行數(shù)據(jù)發(fā)現(xiàn)和保護(hù)

使用人工智能進(jìn)行數(shù)據(jù)發(fā)現(xiàn)和保護(hù)可以顯著提高數(shù)據(jù)發(fā)現(xiàn)和保護(hù)解決方案的準(zhǔn)確性和可靠性。企業(yè)可以在數(shù)據(jù)發(fā)現(xiàn)過程中使用各種人工智能模型和技術(shù)來獲得以下優(yōu)勢:

640 (1).png

1.識(shí)別非結(jié)構(gòu)化數(shù)據(jù)

與基于規(guī)則的系統(tǒng)不同,基于人工智能的解決方案可以識(shí)別結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)中的敏感記錄。借助大型語言模型(LLM)和自然語言處理(NLP),此類解決方案可以檢測信件、聊天日志、文本文件以及其他無法由規(guī)則完全定義的來源中的敏感信息。

對(duì)非結(jié)構(gòu)化數(shù)據(jù)的分析使人工智能驅(qū)動(dòng)的敏感數(shù)據(jù)發(fā)現(xiàn)工具變得可靠,并有助于提高組織的整體網(wǎng)絡(luò)安全態(tài)勢。

2.實(shí)時(shí)檢測新記錄

人工智能算法不需要迭代掃描可用環(huán)境來發(fā)現(xiàn)新數(shù)據(jù)。相反,他們可以分析新的和編輯的記錄,從而顯著加快檢測速度并避免瓶頸。一些敏感數(shù)據(jù)發(fā)現(xiàn)工具既使用基于規(guī)則的掃描進(jìn)行常規(guī)數(shù)據(jù)檢查,又使用人工智能模型來更準(zhǔn)確地分析非結(jié)構(gòu)化記錄。

3.增強(qiáng)流程自動(dòng)化

基于人工智能的工具可以可靠地自動(dòng)化數(shù)據(jù)發(fā)現(xiàn)、分類和保護(hù)期間的大多數(shù)活動(dòng)。初始配置后,他們很少需要手動(dòng)輸入和額外的調(diào)整。高水平的自動(dòng)化可以幫助企業(yè)加快數(shù)據(jù)發(fā)現(xiàn)速度,并將網(wǎng)絡(luò)安全專家從日常任務(wù)中解放出來,使他們能夠?qū)W⒂谛枰鋵I(yè)知識(shí)的挑戰(zhàn)。

4.正確分類和保護(hù)數(shù)據(jù)

由于能夠理解數(shù)據(jù)的含義和上下文,人工智能可以準(zhǔn)確地對(duì)發(fā)現(xiàn)的任何存儲(chǔ)格式的記錄進(jìn)行分類。正確的分類和敏感度分?jǐn)?shù)允許人工智能選擇相關(guān)的記錄,并采取相應(yīng)的安全措施,改善組織的安全狀況并遵守相關(guān)的安全要求。

5.從數(shù)據(jù)分析中獲得見解

由人工智能驅(qū)動(dòng)的數(shù)據(jù)發(fā)現(xiàn)解決方案會(huì)生成并收集大量與其工作相關(guān)的數(shù)據(jù),包括新敏感記錄的性質(zhì)和位置、分類結(jié)果以及常見的數(shù)據(jù)安全策略違規(guī)行為。此類軟件可以使用這些數(shù)據(jù)創(chuàng)建儀表板,幫助安全專家快速評(píng)估和改進(jìn)發(fā)現(xiàn)和保護(hù)流程。

該解決方案還可以創(chuàng)建有關(guān)最近事件和數(shù)據(jù)保護(hù)狀態(tài)的自動(dòng)報(bào)告,這些報(bào)告對(duì)于深入評(píng)估組織的安全性和通過合規(guī)性審核非常有用。

使用人工智能進(jìn)行數(shù)據(jù)發(fā)現(xiàn)可以將數(shù)據(jù)發(fā)現(xiàn)解決方案提升到一個(gè)新的水平,并提高組織的網(wǎng)絡(luò)安全性。然而,以高效且經(jīng)濟(jì)高效的方式實(shí)施它需要在網(wǎng)絡(luò)安全領(lǐng)域使用人工智能的經(jīng)驗(yàn)。

人工智能數(shù)據(jù)發(fā)現(xiàn)和保護(hù)工具如何工作

用于數(shù)據(jù)發(fā)現(xiàn)和保護(hù)的高級(jí)解決方案可以執(zhí)行從文件掃描到數(shù)據(jù)分析和風(fēng)險(xiǎn)報(bào)告的各種活動(dòng)。此類工具可能完全基于人工智能算法或具有附加人工智能功能的基于規(guī)則的系統(tǒng)。

雖然每個(gè)解決方案都有自己的殺手級(jí)功能和工作流程,但可以將大多數(shù)基于人工智能的工具所經(jīng)歷的數(shù)據(jù)發(fā)現(xiàn)過程概述為以下關(guān)鍵階段:

640 (1).png

1.數(shù)據(jù)掃描

AI解決方案持續(xù)監(jiān)控它可以訪問的環(huán)境以獲取新數(shù)據(jù):云和本地服務(wù)器、數(shù)據(jù)庫、設(shè)備驅(qū)動(dòng)器等。數(shù)據(jù)發(fā)現(xiàn)和保護(hù)解決方案的管理員可以配置它應(yīng)查找的數(shù)據(jù)類型并提供對(duì)實(shí)例的訪問它應(yīng)該監(jiān)控。

掃描通常包括以下關(guān)鍵步驟:

·監(jiān)控可訪問存儲(chǔ)實(shí)例的更改和新記錄

·識(shí)別潛在敏感記錄

·準(zhǔn)備非結(jié)構(gòu)化數(shù)據(jù)進(jìn)行處理

當(dāng)解決方案發(fā)現(xiàn)包含潛在敏感數(shù)據(jù)的文件時(shí),它會(huì)嘗試對(duì)其進(jìn)行分類。

2.數(shù)據(jù)分類和標(biāo)記

根據(jù)其配置,軟件可以通過以下方式對(duì)發(fā)現(xiàn)的記錄進(jìn)行分類:

·敏感數(shù)據(jù)的類型。該解決方案可以識(shí)別個(gè)人、財(cái)務(wù)或制造數(shù)據(jù)以及知識(shí)產(chǎn)權(quán)。在這個(gè)階段使用LLM和NLP等人工智能技術(shù)有助于對(duì)非結(jié)構(gòu)化數(shù)據(jù)進(jìn)行高精度分類。

·敏感度得分。該解決方案可以根據(jù)數(shù)據(jù)的性質(zhì)、位置、所應(yīng)用的保護(hù)措施和其他因素來計(jì)算發(fā)現(xiàn)的記錄的敏感程度。此分?jǐn)?shù)有助于解決方案決定在后續(xù)處理階段如何處理數(shù)據(jù)以及何時(shí)需要通知系統(tǒng)管理員。

分類完成后,解決方案會(huì)為發(fā)現(xiàn)的記錄分配標(biāo)簽。標(biāo)簽通常包括數(shù)據(jù)類型、與其交互所需的訪問級(jí)別以及限制級(jí)別。解決方案管理員還可以創(chuàng)建自定義標(biāo)簽。

3.保護(hù)

數(shù)據(jù)發(fā)現(xiàn)軟件為保護(hù)其發(fā)現(xiàn)的數(shù)據(jù)而采取的步驟完全取決于組織的網(wǎng)絡(luò)安全標(biāo)準(zhǔn)和環(huán)境、適用的法規(guī)等。通常,人工智能驅(qū)動(dòng)的軟件可以實(shí)施以下數(shù)據(jù)保護(hù)措施:

·加密

·準(zhǔn)入政策

·將數(shù)據(jù)傳輸?shù)礁踩拇鎯?chǔ)

·去識(shí)別化和匿名化

·數(shù)據(jù)脫敏

4.警報(bào)和分析

除了持續(xù)的發(fā)現(xiàn)和保護(hù)過程之外,還可以使用人工智能算法來處理他們收集的數(shù)據(jù)并編譯有用的儀表板:

·當(dāng)前需要管理員解決的安全威脅

·各種數(shù)據(jù)記錄和存儲(chǔ)實(shí)例的風(fēng)險(xiǎn)評(píng)分

·常見的數(shù)據(jù)保護(hù)違規(guī)行為,這可能表明有害的用戶行為和安全策略中的漏洞

·應(yīng)用保護(hù)與合規(guī)性要求之間的不一致

此類數(shù)據(jù)分析和可視化能夠檢測企業(yè)保護(hù)中的薄弱環(huán)節(jié)并改進(jìn)安全策略。

盡管數(shù)據(jù)發(fā)現(xiàn)和保護(hù)軟件幾乎可以完全自動(dòng)工作,但網(wǎng)絡(luò)安全專家必須概述其決策,以確保充分的數(shù)據(jù)保護(hù)。當(dāng)此類軟件發(fā)現(xiàn)敏感度較高或存在較多安全風(fēng)險(xiǎn)的新記錄時(shí),它可以通知管理員。然后,管理員可以查看解決方案分配的保護(hù)措施,并根據(jù)需要進(jìn)行更改。

如何應(yīng)對(duì)人工智能驅(qū)動(dòng)的數(shù)據(jù)發(fā)現(xiàn)的關(guān)鍵挑戰(zhàn)

構(gòu)建自定義數(shù)據(jù)發(fā)現(xiàn)和保護(hù)工具總是會(huì)面臨針對(duì)客戶群體、需求和合規(guī)性要求所特有的挑戰(zhàn)。

640 (1).png

1.相關(guān)數(shù)據(jù)存儲(chǔ)集成

為了能夠發(fā)現(xiàn)所有敏感數(shù)據(jù),工具需要訪問和讀取組織所有環(huán)境中的記錄。但是,為所有可能的云和本地存儲(chǔ)實(shí)例添加API需要開發(fā)人員花費(fèi)大量時(shí)間,并且可能會(huì)引入安全漏洞。在開始開發(fā)之前,會(huì)采訪客戶的利益相關(guān)者,以了解他們的環(huán)境,僅添加他們需要的集成,并保護(hù)已實(shí)施的API。

2.可靠的開發(fā)組件

使用第三方組件可以顯著加快開發(fā)過程,但也會(huì)增加在解決方案中添加后門的風(fēng)險(xiǎn)。為了找到開發(fā)時(shí)間和安全性之間的平衡,將會(huì)測試第三方軟件并使用已知漏洞數(shù)據(jù)庫對(duì)其進(jìn)行檢查,然后再將其添加到客戶的解決方案中。

如果解決方案使用GPT或Claude等商業(yè)語言模型,可以創(chuàng)建一個(gè)私有數(shù)據(jù)庫來訓(xùn)練它或在本地部署模型,以避免與其他公司共享數(shù)據(jù)。

3.均衡的資源利用

與任何基于人工智能的解決方案一樣,持續(xù)的數(shù)據(jù)發(fā)現(xiàn)可能非常消耗資源,特別是當(dāng)企業(yè)不斷生成大量數(shù)據(jù)時(shí),這可能會(huì)導(dǎo)致高昂的云使用成本或需要維護(hù)強(qiáng)大的本地計(jì)算機(jī)。為了避免開發(fā)和維護(hù)成本飆升,采用了敏捷和DevOps實(shí)踐,優(yōu)化AI性能以消除不必要的操作,并實(shí)施靈活的擴(kuò)展機(jī)制。

4.安全配置

人工智能數(shù)據(jù)發(fā)現(xiàn)和保護(hù)工具需要訪問和管理其管理環(huán)境中的任何記錄。這些記錄可能會(huì)被黑客或內(nèi)部人員濫用,以尋求訪問敏感數(shù)據(jù)而不被注意到的方法。限制工具的安全權(quán)限將阻礙其效率,因此,會(huì)尋求性能和安全性之間的平衡:配置對(duì)記錄的即時(shí)訪問、發(fā)現(xiàn)數(shù)據(jù)時(shí)匿名化、為管理員添加數(shù)據(jù)操作通知等。

5.人工智能偏見

任何基于人工智能的解決方案都會(huì)帶有其開發(fā)人員和訓(xùn)練數(shù)據(jù)集的偏見。

對(duì)于數(shù)據(jù)發(fā)現(xiàn)和保護(hù)解決方案,這種偏差可能會(huì)導(dǎo)致數(shù)據(jù)分類不正確或安全措施執(zhí)行不足。在產(chǎn)品發(fā)布之前檢測人工智能偏差的最可靠方法是通過廣泛的測試。

培養(yǎng)人工智能、網(wǎng)絡(luò)安全和數(shù)據(jù)管理等復(fù)雜軟件開發(fā)領(lǐng)域的專業(yè)知識(shí)。憑借為來自嚴(yán)格監(jiān)管行業(yè)的客戶構(gòu)建定制解決方案的經(jīng)驗(yàn),可以盡早概述關(guān)鍵的開發(fā)挑戰(zhàn)并提供克服這些挑戰(zhàn)的方法。

結(jié)論

數(shù)據(jù)發(fā)現(xiàn)和保護(hù)工具是任何企業(yè)網(wǎng)絡(luò)安全的重要組成部分,因?yàn)樗鼈優(yōu)榭煽康臄?shù)據(jù)安全和管理奠定了基礎(chǔ)。此類工具可以跨任何云、本地和混合基礎(chǔ)設(shè)施發(fā)現(xiàn)敏感數(shù)據(jù),并根據(jù)企業(yè)的策略和合規(guī)性要求實(shí)施網(wǎng)絡(luò)安全措施。

通過人工智能增強(qiáng)數(shù)據(jù)發(fā)現(xiàn)和保護(hù),將此類解決方案提升到一個(gè)新的水平。與基于規(guī)則的系統(tǒng)相比,人工智能可以發(fā)現(xiàn)非結(jié)構(gòu)化數(shù)據(jù)并對(duì)其進(jìn)行分類,犯的錯(cuò)誤更少,不需要大量的手動(dòng)輸入,并可以收集數(shù)據(jù)以用于未來的安全改進(jìn)。

但要構(gòu)建人工智能驅(qū)動(dòng)的數(shù)據(jù)發(fā)現(xiàn)解決方案并安全地部署它,用戶需要聘請網(wǎng)絡(luò)安全、人工智能開發(fā)和數(shù)據(jù)管理方面的專家。

THEEND

最新評(píng)論(評(píng)論僅代表用戶觀點(diǎn))

更多
暫無評(píng)論