漫談軟件成分分析(SCA)安全測試技術(shù)
1、什么是SCA
SCA(Software Composition Analysis)軟件成分分析,通俗的理解就是通過分析軟件包含的一些信息和特征來實現(xiàn)對該軟件的識別、管理、追蹤的技術(shù)。我們知道在當(dāng)今軟件開發(fā)中,引入開源軟件(注1)到你的項目中,避免重復(fù)造輪子是大家都再熟悉不過的了,比如開源庫中開源軟件按每年21%速度在增長(來源Forrester報告),開源安全威脅成為企業(yè)組織無法回避的話題,而應(yīng)用SCA技術(shù)對應(yīng)用程序進行安全檢測,實現(xiàn)安全管理是最行之有效的方法之一。
2、基本原理
1.?SCA理論上來說是一種通用的分析方法,可以對任何開發(fā)語言對象進行分析,Java、C/C++、Golang、Python、JavaScript等等,它對關(guān)注的對象是從文件層面的文件內(nèi)容,以及文件與文件之間的關(guān)聯(lián)關(guān)系以及彼此組合成目標(biāo)的過程細(xì)節(jié)。從SCA 分析的目標(biāo)程序形式上分,既可以是源代碼也可以是編譯出來的各種類型的二進制文件,分析的數(shù)據(jù)對象對程序架構(gòu),編譯方式都是不敏感的,比如:類名稱、方法/函數(shù)名稱、常量字符串等等,不管目標(biāo)程序運行在x86平臺還是ARM平臺,不管是windows程序還是Linux程序,都是一樣的,簡而言之SCA 是一種跨開發(fā)語言的應(yīng)用程序分析技術(shù)。
2.?SCA分析過程:首先對目標(biāo)源代碼或二進制文件進行解壓,并從文件中提取特征,再對特征進行識別和分析,獲得各個部分的關(guān)系,從而獲得應(yīng)用程序的畫像—–組件名稱+版本號,進而關(guān)聯(lián)出存在的已知漏洞清單。
3.?由于SCA分析過程中不需要把目標(biāo)程序運行起來,因此具有分析過程對外部依賴少,分析全面,快捷、效率高的優(yōu)點;
3、業(yè)界TOP SCA工具分析
根據(jù)Forrester最新SCA報告,F(xiàn)orrester通過10個維度(注3)對不同工具進行打分,最后根據(jù)綜合得分評選出如下業(yè)界TOP 10 SCA工具魔力象限圖):


注:圖片和數(shù)據(jù)引用來自Forrester報告
3.1工具概覽分析
1.?TOP 10 SCA工具中有5款支持軟件包(注2)開源軟件SCA檢查能力(synopsys/Sonatype/Veracode/Jfrog/GitLab),其他工具只支持源代碼SCA檢查能力。
2.?5款支持軟件包SCA檢查工具中,對C/C++、Java、.Net語言支持的比較好,但對Golang、python、JavaScript語言支持能力偏弱,比如:synopsys支持的組件對象中前面3種語言占大頭90%+,相應(yīng)的檢測率也高,而Golang語言的組件檢出率則低很多。
3.?SCA已從主要用作對開源軟件的檢測向應(yīng)用程序的典型編碼問題檢測趨勢擴展,比如Veracode工具,它能提供了對諸如緩沖器溢出、命令行注入、死鎖、重復(fù)釋放、整形數(shù)溢出、UAF、格式化字符串漏洞,SQL注入等典型編碼問題的檢測能力。
4、影響SCA分析準(zhǔn)確性的因素分析
1.?從SCA原理可以知道影響分析準(zhǔn)確性的因素分兩個方面:其一是SCA工具支持組件的數(shù)量和檢測算法,其二是應(yīng)用程序引用開源軟件的方式。
2.?因為SCA工具是根據(jù)樣本組件特征來匹配被測程序中的特征來判斷應(yīng)用程序是否引用該組件的,因此支持組件的數(shù)量越多,那么檢測率也就越高,支持的組件數(shù)量越少,越會導(dǎo)致檢測遺漏;另外檢測算法和特征設(shè)計是否合理也直接影響到分析的準(zhǔn)確性和分析效率,不同SCA工具廠商有不同的解決方案,就好比在手機上識別指紋/人臉一樣,不同廠商識別的靈敏度和準(zhǔn)確度都不一樣。
3.?應(yīng)用程序在引用開源軟件時,不同的應(yīng)用程序即使引用同一個組件也存在引用不同的功能,引用功能的多少也各不相同,這樣帶來的結(jié)果就是在應(yīng)用程序中包含該組件的特征數(shù)量也是大小不同的,引用功能多包含的特征一般也多,引用的功能少包含的特征也少。而應(yīng)用程序包含組件特征的多少直接影響到SCA工具的檢測的準(zhǔn)確性,組件特征越少SCA工具檢測越困難,因此即使兩個不同應(yīng)用都引用了相同組件,可能一個應(yīng)用可以檢測到,另外一個應(yīng)用則無法檢測出該組件。這種場景對SCA工具檢測二進制文件尤其明顯。
4.?由于存在上述SCA分析準(zhǔn)確性,在極限情況下如果無法檢測出組件,那么也就無法知道應(yīng)用程序中是否存在該組件的漏洞了。
5、總結(jié):
1.?不管是源代碼文件的SCA檢測工具還是二進制文件的SCA檢測工具,他們是一種互補的關(guān)系,各有各的優(yōu)缺點,比如二進制文件的SCA檢測能發(fā)現(xiàn)構(gòu)建過程中工具鏈引入的安全問題,而源代碼的SCA則不能,SolarWinds事件就很好的說明了這一點。
2.?目前SCA工具檢測開源軟件的已知漏洞是基于組件名稱+版本號來關(guān)聯(lián)出已知漏洞的,對部分編譯場景(只有部分組件代碼被編譯到二進制文件中)和patch打補丁場景(漏洞已修復(fù)),誤報率高。
3.?SCA工具掃描效率和準(zhǔn)確性是一對矛盾體,這是工具廠商需要權(quán)衡考慮的地方,而既能提升準(zhǔn)確率又不會降低掃描效率的技術(shù)永遠(yuǎn)是SCA工具廠商研究的課題和追求的目標(biāo)。
注1:Top 10開源軟件編程語言:JavaScript(51%)、C++(10%)、Java(7%)、Python(7%)、Ruby(%5)、Go(4%)、C(4%)、PHP(4%)、TypeScript(4%)、C#(3%)、Perl(2%)、Shell(1%)
注2:軟件包是指產(chǎn)品用來安裝、運行的發(fā)布包,里面包含了產(chǎn)品編譯好的可以運行的二進制文件,比如.so/.jar/.exe/.dll/.pyc
?