遇到GPU、NPU、DPU在不迷茫?各類(lèi)芯片掃盲!?。?/h1>

????大家好 ,我是一點(diǎn)通。想必大家閱讀芯片類(lèi)文章的時(shí)候,CPU、GPU、NPU、Soc等常用名詞不絕于耳。不過(guò)當(dāng)別人問(wèn)你是啥的時(shí)候,估計(jì)很多人都會(huì)支支吾吾說(shuō)不出啥來(lái)。今天我就帶大家來(lái)掃盲一下。

cpu是中央處理器。其事就是機(jī)器的“大腦”,也是布局謀略、發(fā)號(hào)施令、控制行動(dòng)的“總司令官”。
CPU的結(jié)構(gòu)主要包括運(yùn)算器(ALU, Arithmetic and Logic Unit)、控制單元(CU, Control Unit)、寄存器(Register)、高速緩存器(Cache)和它們之間通訊的數(shù)據(jù)、控制及狀態(tài)的總線(xiàn)。
簡(jiǎn)單來(lái)說(shuō)就是:計(jì)算單元、控制單元和存儲(chǔ)單元。(架構(gòu)如下圖)

如果你看不懂,我可以把他翻譯成中文。簡(jiǎn)單來(lái)說(shuō)就是,計(jì)算單元主要執(zhí)行算術(shù)運(yùn)算,存儲(chǔ)單元主要保存數(shù)據(jù)以及指令等;控制單元?jiǎng)t對(duì)指令譯碼。
????

2、GPU
GPU叫做圖形處理器,又稱(chēng)顯示核心、視覺(jué)處理器、顯示芯片。

圖形處理你是不是想到了顯卡?提到顯卡和GPU,人們會(huì)想到游戲和電影中精美的三維圖形。其實(shí),早期顯卡不但不能處理三維圖形,甚至連二維圖形都無(wú)法處理,它僅具備顯示能力。今天,GPU不但能夠處理復(fù)雜的三維圖形,還能作為協(xié)處理器,在通用計(jì)算中使用。
電腦圖形處理器的發(fā)展是從圖形顯示適配器開(kāi)始的,到圖形加速器,再到圖形處理器即GPU,其功能在不斷增強(qiáng)。
3、MCU
mcu是微控制器,控制著汽車(chē)內(nèi)所有的電子系統(tǒng),比如多媒體、音響、導(dǎo)航、懸掛等。作為汽車(chē)電子控制系統(tǒng)的核心,mcu必須有著耐高溫和堅(jiān)固的特性,使之在復(fù)雜的汽車(chē)內(nèi)部環(huán)境中不容易損壞。

MCU分為1位、4位、8位、16位、32位甚至64位單片機(jī)。4位MCU大部分應(yīng)用在計(jì)算器、車(chē)用儀表、車(chē)用防盜裝置。
4、NPU
近幾年NPU特別火,我們可以理解為NPU就是AI芯片,普通芯片就是CPU。在自動(dòng)駕駛和智能座艙都離不開(kāi)NPU。換句話(huà)說(shuō),npu是具備智能和學(xué)習(xí)的特性, 也就是說(shuō)這個(gè)處理器它是會(huì)模仿人的大腦神經(jīng)網(wǎng)絡(luò)的。在工作模式上,CPU主要是負(fù)責(zé)低精度,各種普通的數(shù)據(jù),npu則是人工智能算法上面運(yùn)行效率要高于另外兩者。

上層的應(yīng)用程序可以通過(guò)加載模型與數(shù)據(jù)到 NPU 進(jìn)行計(jì)算,也可以使用 NPU 提供的軟件 API 操作 NPU 執(zhí)行計(jì)算。
NPU包括三個(gè)部分:可編程引擎(Programmable Engines,PPU)、神經(jīng)網(wǎng)絡(luò)引擎(Neural Network Engine,NN)和各級(jí)緩存。
可編程引擎可以使用 EVIS 硬件加速指令與 Shader 語(yǔ)言進(jìn)行編程,也可以實(shí)現(xiàn)激活函數(shù)等操作。
神經(jīng)網(wǎng)絡(luò)引擎包含 NN 核心與 Tensor Process Fabric(TPF,圖中簡(jiǎn)寫(xiě)為 Fabric) 兩個(gè)部分。NN核心一般計(jì)算卷積操作, Tensor Process Fabric 則是作為 NN 核心中的高速數(shù)據(jù)交換的通路。算子是由可編程引擎與神經(jīng)網(wǎng)絡(luò)引擎共同實(shí)現(xiàn)的。
NPU 支持 UINT8,INT8,INT16 三種數(shù)據(jù)格式。
5、SoC
SoC芯片是芯片的一種,簡(jiǎn)單的理解就是把幾種不同類(lèi)型的芯片集成到一塊芯片上,比如把CPU?、GPU?、存儲(chǔ)器?、藍(lán)牙芯片等集成到一個(gè)芯片上。
再例如,智能座艙上的wifi功能和藍(lán)牙功能,都是集成在SoC芯片之上,例如8155就屬于SoC芯片。
6、TOPS
TOPS也是我們常說(shuō)的算力,1 TOPS代表處理器每秒鐘可進(jìn)行一萬(wàn)億次。我們熟知的8155芯片算力是8TOPS,英偉達(dá) orin芯片算力為254TOPS。
汽車(chē)從L1、L2、L3、L4、L5不斷推進(jìn),某種意義上看,就是算力的競(jìng)賽,每往上進(jìn)階一級(jí)就意味著對(duì)算力的需求更高。
毫無(wú)疑問(wèn),當(dāng)前的自動(dòng)駕駛芯片市場(chǎng)發(fā)生了明顯的變化,“大算力”正是一大趨勢(shì)。除了英偉達(dá),算力突破100TOPS的芯片陸續(xù)問(wèn)世,比如已發(fā)布單顆芯片最高算力可達(dá)128TOPS的地平線(xiàn)征程5;單顆芯片最高算力可達(dá)176TOPS的Mobileye EyeQ Ultra等。
7、DMIPS
常常有人會(huì)把TOPS和DMIPS搞混,認(rèn)為這兩個(gè)詞語(yǔ)都在表達(dá)同一種計(jì)算能力。其實(shí)并非如此,DMIPS是每秒處理機(jī)器語(yǔ)言指令數(shù),而TOPS是每秒鐘可以進(jìn)行的操作數(shù)量。
例如8155芯片CPU能夠達(dá)到105K DMIPS執(zhí)行能力,算力是8TOPS,這顯然是芯片兩塊不同領(lǐng)域的處理能力。
DMIPS是,用Dhrystone這套測(cè)試程序跑下來(lái),每秒鐘可以執(zhí)行多少指令。
某種意義上,誰(shuí)家的這個(gè)數(shù)字高,誰(shuí)家的CPU就更牛。50000DMIPS就意味著每秒可以執(zhí)行50000*100萬(wàn)條指令。
8、DPU
DPU和NPU的組合很像TOPS和DMIPS,很容易搞混。
DPU和NPU都是具有學(xué)習(xí)能力的芯片,只是DPU是深度學(xué)習(xí)處理器,是基于Xilinx可重構(gòu)特性的FPGA芯片。而NPU不基于Xilinx。
不同于CPU的AI芯片,DPU可以用于機(jī)器學(xué)習(xí)、安全、電信和存儲(chǔ)等應(yīng)用,并提升性能。
DPU是以數(shù)據(jù)為中心 IO密集的專(zhuān)用處理器。DPU對(duì)現(xiàn)有的SmartNIC?做了整合,能看到很多以往?SmartNIC?的影子,但明顯高于之前任何一個(gè)?SmartNIC?的定位。DPU可以實(shí)現(xiàn)多種功能。以 Nvidia BlueField 架構(gòu)為例,其功能模塊如下圖。

最近很火的賽道 電動(dòng)車(chē)也涉及了大量芯片 這里小編也順便介紹一下:
汽車(chē)芯片的種類(lèi)
汽車(chē)芯片的三大類(lèi):
1、整車(chē)域的MCU。
2、自動(dòng)駕駛域的AI芯片
3、智能座艙域的CPU。這三大門(mén)類(lèi)都需要芯片,但是難度系數(shù)卻相差很多。
汽車(chē)芯片從MCU到自動(dòng)駕駛座艙,雖然有如果說(shuō)MCU芯片的弱雞性能讓汽車(chē)的面子有點(diǎn)掛不住,那自動(dòng)駕駛域的AI芯片可以說(shuō)是扳回一城了。
1、自動(dòng)駕駛域的AI芯片
以英偉達(dá)orin為例,orin的CPU內(nèi)核是12個(gè)Coretex-A78(代號(hào)Hercules),GPU是Ampere。
我們拿蔚來(lái)ET7舉例。

CUBA單元:蔚來(lái)ET7搭載了四顆NVIDIA ORIN芯片(近1000TOPS),其CUBA(Compute Unified Device Architecture)單元達(dá)8096,接近8704CUBA核心的RTX3080顯卡。
晶體管數(shù)量:蔚來(lái)ET7搭載四顆NVIDIA ORIN芯片的晶體管數(shù)量為680億,同期“秒天秒地秒一切”的蘋(píng)果A14芯片的晶體管數(shù)量為118億。
數(shù)據(jù)處理量:特斯拉FSD芯片內(nèi)置圖片處理器ISP,最高以25億像素/秒的速度處理圖像,大概是往21塊1080P的高清屏幕上塞60幀畫(huà)面。
NPU:特斯拉FSD芯片的神經(jīng)處理單元NPU高速緩存32MB,與零售價(jià)16999元的英特爾酷睿i9-9980XE的33.75MB SRAM緩存總量相當(dāng)
2、智能座艙芯片
智能座艙的主芯片一般稱(chēng)之為SoC – System on Chip即片上系統(tǒng),它包括CPU、GPU,AI引擎,還包括處理各種各樣攝像頭的ISP,支持多顯示屏的DPU、集成音頻處理等等。另外第3代的數(shù)字座艙系統(tǒng),配備了個(gè)性化的計(jì)算機(jī)視覺(jué)和機(jī)器學(xué)習(xí)的計(jì)算機(jī)應(yīng)用平臺(tái),包含AI加速器等等。同時(shí),高通在SoC上也集成了先進(jìn)的Wi-Fi、藍(lán)牙技術(shù),可以支持眼下最熱的Wi-Fi6以及藍(lán)牙5.1的技術(shù)。
提到智能座艙芯片,不得不看高通驍龍8155芯片。
高通的8155芯片是一枚強(qiáng)大的智能座艙SOC芯片,全稱(chēng)是SA8155P,它采用7納米工藝制造,具有八個(gè)核心CPU,算力為8TOPS,也就是每秒運(yùn)算8萬(wàn)億次,它可以最多支持6個(gè)攝像頭,連接4塊2K屏幕或者3塊4K屏幕,支持WiFi6,支持5G,支持藍(lán)牙5.0。

值得注意的是,8155芯片并沒(méi)有獨(dú)立的NPU內(nèi)核,AI計(jì)算主要通過(guò)DSP、CPU和GPU組成的AI引擎完成。其中,Hexagon 690擁有7TOPS的AI算力,加上CPU、GPU的AI算力之和為8TOPS。而在制程方面,高通8155采用臺(tái)積電N7工藝,也就是第一代7nm工藝打造,與驍龍855以及855+屬于同一代產(chǎn)品。
3、整車(chē)域MCU
在智能化未普及之前,早期汽車(chē)是純機(jī)械產(chǎn)品。那時(shí)的發(fā)動(dòng)機(jī)并沒(méi)有電子控制器、車(chē)窗也只有機(jī)械式控制,所以不需要任何芯片,更沒(méi)有算力、圖像處理這一說(shuō)法。
在近幾十年中,機(jī)械式的汽車(chē)逐步智能化。一次新增一個(gè)功能,就需要配一個(gè)MCU(Micro Control Unit)。這種發(fā)展方式,造成了MCU越多,線(xiàn)束凌亂的現(xiàn)狀。這也構(gòu)成了傳統(tǒng)車(chē)企缺芯的現(xiàn)象。
當(dāng)然,也不要小看MCU,這個(gè)領(lǐng)域支撐起來(lái)的半導(dǎo)體公司都是赫赫有名。如果對(duì)比的是汽車(chē)MCU芯片 —— 那的確,無(wú)論是性能上、制程上,手機(jī)芯片都要先進(jìn)不少!