新聞動態
行業動態
ARM今天發布了全新的旗艦級CPU Cortex-A73,代號Artemis,10nm FinFET工藝下面積還不到0.65平方毫米,而頻率可高達2.8GHz,峰值性能、持續性能都可比A72提升最多30%,華為海思、三星電子、聯發科、Marvell等都已經簽署授權。
ARM高端CPU簡史:發熱是個大問題
在深入了解A73之前,我們先來回顧一下ARM這幾年的高端移動CPU,首先是A9。
A9可以說是里程碑式的產品,奠定了ARM今后多年的堅實基礎,也誕生了大量優秀處理器芯片,比如蘋果A5、三星Exynos 4210/4412、德州儀器OMAP4430/4460。
之后是A15,IPC(每時鐘周期在指令數)提升是Cortex-A系列歷史上最大的,性能很猛,代價就是功耗也高了,三星的Exynos 5250/5410就備受困擾。
為了解決性能與功耗的平衡問題,ARM提出了big.LITTLE混合架構,也誕生了海思麒麟920、三星Exynos 5422這樣一些成功產品。
A57是首個64位移動大核心,而在蘋果A7的刺激下,整合移動行業向64位飛奔,但是A57核心太大了,功耗和發熱難以控制,結果要么就是驍龍810這種硬上A75的因為過熱而陷入麻煩,要么就是麒麟930、聯發科Helio X10這樣只敢上A53小核心的性能還不如前輩。
三星此時異軍突起,Exynos 5433/7420成功控制了A57,再加上三星工藝的進步,一時間霸氣側漏。
A72雖然只是A57的改良版,但效果很好,比如說驍龍650/652這樣的中端產品,已經可以逼近甚至超越上代旗艦級的驍龍808/810。
A73身世揭秘:和A72無關
A15、A57、A72架構上都屬于Austin(奧斯?。?,A5、A7、A53均屬于Cambridge(劍橋),A12、A17和今天的A73則都來自于Sophia(索菲亞)——位于法國南部風景迷人地中海之濱的索菲亞科技園區(Sophia Antipolis),是歐洲最大的科技園區,ARM CPU的法國設計團隊就在那兒。
從產品定位上看,A73顯然要取代A72,但是從技術層面講,它其實是A17的進化版本,整體微架構、流水線、寬度設計都與之類似,反而和A72差別很大。
最明顯的就是,A72采用了三發射設計,A73則是雙發射的,但加上其他改進,結果就是性能高于A72、功耗低于A72。
顯然,ARM充分意識到了移動處理器能效的重要性,宣傳A73的時候也特別強調其持續性能,即能夠長期穩定運行的表現。
A73架構解析:性能與功耗兼得
為了便于理解A73的不同,我們先來看看A72的架構圖:
15+級亂序流水線,128位預取,3寬度解碼,每時鐘周期可分派最多5個微操,滿足最多7個發射隊列,進入8個執行流水線。
A73十分類似A17,因為順序前端的優化流水線短得多,預取階段也只有4級深度(A72 5級),整個流水線深度也才11-12級。
相比于A17,它將整體最大分配率從4個微操增加到了6個。NEON發射序列仍然是2個微操,但是整數部分翻番到了4個。
浮點流水線還是2條,預取監視器也是1個,但是AGU部分可同時執行載入和存儲操作。整數流水線則分成了2個復雜的ALU,分別負責乘法和除法。
A73繼承了A17的架構理念,優化流水線、資源和接口,以求在最低功耗下獲得最大性能,并且特別注意了32/64位架構之間的平衡。
A73依然堅持四核心理念,即每個簇可擁有1-4個核心,然后使用SCU單元互聯各個簇。二級緩存最多8MB,等同于A17而兩倍于A72,但相信多數芯片廠商都會選擇1-2MB。
A15/57/72還肩負著沖擊工業、大規模服務器系統的重任,A73就簡單了,只針對消費級市場,這讓它輕松了不少,比如去掉了AMBA5 CHI接口,僅支持AMBA4 ACE,一級緩存也不再支持ECC。
內存系統的變化也異常重要,雙發射載入/存儲單元扮演了大角色,提高了發射率。
數據緩存尋址機制從PIPT(物理索引物理標簽)變成了VIPT(虛擬索引物理標簽),數據緩存最大64KB,翻了一番,號稱僅此就能提升4%的性能。
一級和二級緩存的預取器也有了大幅改進,再加上其他種種完善,號稱外部內存帶寬可提升最多20%。
更深入的架構細節我們暫時就不談了,技術性太強,一般用戶也無需關心,只要知道A73的成果就行了:
相比A72,典型移動應用性能提升10%,SIMD媒體和計算性能提升5%,內存吞吐能力提升15%。
整數應用功耗節省最多30%,浮點和二級緩存應用節省最多25%。同等工藝頻率下至少節省20%。
迄今最小的高端核心,同等工藝、性能下比A72小最多25%。
擴展性強,10nm FinFET工藝下再為性能優化一番,如果是四核心、2.8GHz頻率、64KB/64KB一級緩存、2MB二級緩存,核心面積只需大約5平方毫米,功耗不到0.75W。
28nm HPC工藝下,雙核心、2.0GHz頻率、32KB/64KB一級緩存、1MB二級緩存,核心面積約6平方毫米。
看這樣子,16nm下A73核心就應該能達到2.8GHz,10nm有望突破3GHz。
比于四大A53四小A53的八核心,兩大A73四小53組成六核心后,可以在核心面積相同的情況下,性能提升30%,最佳響應時間提升90%!