當前位置:首頁 > 專訪 > 付斌
[導讀]9月23日,Arm宣布Neoverse新增Arm Neoverse V1平臺以及第二代的N系列平臺Neoverse N2,兩款新品使得Neoverse再度進階,而新產品直指的目標則是超級計算機和數據中心。

云計算和邊緣計算這兩個詞是近幾年被電子行業提及頻次最高的詞,伴隨相關應用逐步融入社會各個領域,數據處理便成為了行業首當其沖的領域。

此前,騰訊宣布TARS微服務開發框架已成功移植至Arm CPU架構;百度在其數據中心采用了基于Arm架構的智能計算;亞馬遜AWS云在自己的云服務器上做了一個基于Arm架構的自研項目……

事實上,Arm架構服務器由于其高性能以及自身具備的低功耗素質,已成為數據中心基礎設施建設的焦點。

9月23日,Arm宣布Neoverse新增Arm Neoverse V1平臺以及第二代的N系列平臺Neoverse N2,兩款新品使得Neoverse再度進階,而新產品直指的目標則是超級計算機和數據中心。21ic中國電子網記者受邀參加此次新品發布的在線研討會,揭秘Neoverse處理器IP背后的發展。

01

翻倍,性能沖刺之路

首先,Arm新發布的這兩款Neoverse平臺究竟有多強?直接上數據。通過Arm給出的數據,相比去年推出的Neoverse N1,代號為“Zeus”的Neoverse V1比N1單線程性能提升50%,代號為“Perseus”的Neoverse N2在相同水平的功率和面積之下比N1單線程性能提升40%。

另外,會議上,Neoverse平臺的最新路線圖也一并被披露,圖示顯示Neoverse目前處于制程節點7/5nm上,支持PCle Gen5、DDR5、HBM2e和CCIX 1.1;至2021年將全面進入5nm制程節點,支持HBM3、CCIX 2.0、CXL 2.0;至2022年將進入5/3nm制程節點,支持CCIX next和CXL next。

值得一提的是,會議上,Arm承諾后續的Neoverse產品在2022年以后,每年也都會有30%的性能提升。Arm基礎設施事業部高級副總裁兼總經理Chris Bergey表示,這與Arm工程團隊的努力和投入是分不開的,另一方面,能夠保持穩定的性能提升與Arm自身軟件生態的逐漸成熟有很大關系,例如很多云原生的軟件現在可以比較無縫運行在Arm架構上面。

圖1:Arm Neoverse最新技術發展路線圖

在核心和線程上,以云工作負載為例,可以看出Neoverse V1在96核96線程下擁有極佳的處理能力,可以在核心數更少的情況下發揮更好的性能;Neoverse N2則可以多達128核128線程的設計,擁有極強的擴展性,并在同樣的擴展能力下擁有比N1更強的性能。

圖2:云工作負載使用內核數量

文行至此,可能大家并沒有感受到本次發布的Neoverse V1和N2的強大?那么從Neoverse從初版發布到現如今推出產品的歷史來看起。

Neoverse處理器IP首次亮相于2018年10月18日,同為Arm指令集的IP產品,不同于Cortex系列,Neoverse面向的是高性能計算市場。當時Neoverse平臺產品中代號“Cosmos”的產品是基于16nm工藝,A72、A75核心的產品。當時公布的路線圖中,Arm提出了每年每代產品的30%的單線程性能提升,每一代提升30%也是Arm的“老傳統”。

圖3:2018年Arm公布的Neoverse發展路線圖

但時間推移到下一代產品發布時間2019年2月21日,Neoverse N1和E1平臺被公布出來后,一切預測都被推翻了。屬于7nm工藝時代的Neoverse N1相比A72的“Cosmos”單線程性能提升了60%,超出預計整整一倍,關鍵云端負載性能則提升了高達2.5倍。Neoverse E1作為低功耗和低面積的代表,也擁有不俗的實力,與Arm前幾代方案相比,吞吐量性能提升超過2.7倍,吞吐效率提升超2.4倍,計算性能提升超2倍。

圖4:2019年Arm公布的Neoverse發展路線圖

上文有提到,V1比N1單線程性能提升50%,N2比N1單線程性能提升40%,而這一切的基礎都是在N1超出前一代60%的基礎上完成的。換言之,也就是說V1比“Cosmos”單線程性能出140%,N2比“Cosmos”單線程性能高出124%,超額兩倍完成了2018的初版路線規劃。

02

定位,面向不同市場

Neoverse平臺系列幾經周折,現如今形成了三個定位,這種定位也與現今數據中心市場相符合。另一方面,也與Arm的Cortex的最新定位相呼應,即無視面積和功耗、純粹注重高性能的Cortex-X1、PPA(功率、性能、面積)最大化的Cortex-A78。

1、V系列:追求終極性能的系列產品,性能優先于面積和功耗。擁有最高的帶寬和性能表現,以及最大的Buffers(緩沖區)、Caches(緩存)、Windows(窗口)和Queues(隊列),隨之而來的是最大的面積和功耗。

2、N系列:滿足橫向擴展性能需求的系列產品,最大化PPA,即在性能、功耗和面積上保持平衡。擁有更強的擴展性,更加平衡的性能,同樣面積或TDP下更多的核心數。因為支持更多的線程,因此在橫跨云、智能網卡(SmartNICs)、企業網絡、邊緣設備上都擁有非常廣闊的應用的場景。

3、E系列:低功耗小面積系列產品,面積和功耗優先于性能。擁有更好的效率、吞吐量和線程數,當然最重要的是在面積和功耗上擁有最好的優化。另外,E1還支持同步多線程(SMT)技術,能夠提供網絡效果優化。

圖5:三個系列不同的定位

市場方面,Chris Bergey告訴記者,V系列、N系列、E系列會根據合作伙伴和客戶對于功耗、性能和面積上不同需求進行配置,假若客戶更看重線程,N系列便是首先,假若客戶需要高性能計算工作負載,V系列就能提供更大的價值。

值得一提的是,Neoverse V1和N2均支持可伸縮矢量擴展(Scalable Vector Extensions, SVE),而SVE則可基于未知寬度向量單元的軟件編程模型,執行單指令流多數據流(SIMD)整數、bfloat16、浮點指令。另外,SVE還可確保軟件編碼的可移植性與使用壽命,同時兼顧高效的執行。

利用SVE,半導體廠商可以對SVE電壓和頻率過渡實施控制,開發者可以在窄矢量和寬矢量之間隨意混合代碼。

SiPearl公司營銷副總裁Craig Prunty表示:“Neoverse路線圖上的SVE為HPC和ML帶來了巨大的潛力,我們非常看好這項技術對未來Arm生態系統的發展。”

03

生態,軟硬件鑰匙

在硬件生態方面,支持重要的兩個技術便是CCIX(針對加速器的緩存一致性互聯)和CXL(開放互聯技術)。CCIX主要用于跨芯片間互連,用于打造異構封裝系統,支持完整緩存一致性;CXL則是基于PCle 5.0的規范,可讓CPU與GPU、FPGA等加速器更好地連接,帶來更好地帶寬和內存一致性,簡化硬件設計難度,降低系統成本。

當然,異構計算已逐漸成為現在數據發展的重要“根據地”,事實上,這也是生態中的一環。數據中心無論是存儲還是數據加速,整體趨勢是分布式的,這便對性能和功耗提出嚴苛的要求。Chris Bergey表示,Arm已看到很多異構計算的產品與方案目前都開始基于Arm的架構,例如存儲控制器、智能網卡中用到的計算CPU。

在異構計算方面,對于Arm來說,如何提供緊耦合或是定制化的能力,甚至是通過多核封裝或多芯片組裝技術,將來自生態系統、IP技術與云廠商的需求與技術整合在一起,是很大的機遇。不論是基于FPGA、GPU、TPU單元的加速器,數據的移動是必不可少的,Arm架構的可擴展性便是優異的解決方案。

圖6:CCIX和CXL領導智能未來

在軟件生態方面,Chris Bergey為記者介紹,Arm將軟件分為兩種類型,一是云原生的軟件,二是傳統的企業級軟件。云原生軟件是Arm一直以來重視的領域,在這個領域Arm現在是擁有最大的持續集成/持續交付(CI / CD)平臺的一等公民,并在大多數編程語言的生態環境中,Arm都扮演著核心角色,同時Arm也看到云原生技術在邊緣計算領域變得越來越重要,在這一領域我們推出了Project Cassini項目。

此外,隨著V-RAN、O-RAN等項目的崛起,云原生軟件也將成為5G未來發展的一個重要組成部分。 另一方面,傳統企業軟件領域出現了“軟件即服務”(SaaS)的發展趨勢。面對這一趨勢,由于在Arm架構之上能夠創造非常有利的軟件即服務產品,因此很多獨立軟件開發商(ISV)都對Arm表現出濃厚的興趣,紛紛投入Arm陣營,在中國市場這一趨勢尤其顯著。

圖7:Arm支持的軟件生態

“Arm認為軟件生態系統,特別在基礎設施這個市場上,是非常重要的。” 根據Chris Bergey的介紹,現如今,Arm處理器核在性能方面的優勢,不僅獲得了美國的大型互聯網公司的認可,在中國的大型互聯網公司以及廣大的軟件生態系統層面,也獲得了很多的進展。另外,Arm也很樂于與國內外廠商攜手,利用Neoverse N1和V1來幫助客戶交付相關項目。

換一批

延伸閱讀

[Arm] Arm通過64位計算 突破移動終端的性能與安全局限

新聞摘要: · 自2022年起,Arm推出的 Cortex-A大核都將僅支持64位 · Arm及其合作伙伴鼓勵中國開發者盡快將其應用程序遷移至64位 · Arm揭示其下兩代CPU(代號為Matter...

關鍵字: ARM 移動終端 性能

[芯聞天下] 英特爾、高通、特斯拉、蘋果組成“反對聯盟”:抗議Nvidia-ARM收購案

英偉達400億美元收購ARM一旦交易成功,便可一躍成為本年度半導體最大收購案,但事實上這門“親事”缺遭到了巨頭的一致反對。 日前,外媒fudzill...

關鍵字: 芯片 英偉達 ARM

[半導體] AMD發布銳龍5000處理器

AMD發布銳龍5000處理器

AMD去年發布了基于Zen 2架構的CPU,和Zen相比在性能上提升十分地明顯,不過在單核性能上距離英特爾的10代酷睿處理器還是有一段距離。今天凌晨AMD正式發布了全新的Zen 3架構銳龍5000系列處理器,共有四款型號,分別是59...

關鍵字: 處理器 銳龍 ARM

[半導體] 面向自動駕駛車輛高強度工作,Arm發布三款芯片

面向自動駕駛車輛高強度工作,Arm發布三款芯片

未來智能汽車的變革、數據的處理效率、汽車的安全保障,以及新的電子架構和自動駕駛的技術等等都離不開芯片。而最近Arm發布了三款芯片,面向自動駕駛車輛的高強度工作負載。 Arm近日發布了幾款全新的IP,旨在讓智能汽車開發商更容易將他們...

關鍵字: 自動駕駛 汽車芯片 ARM

[通信技術] 微軟:ARM版Windows設備將支持x64應用

微軟:ARM版Windows設備將支持x64應用

10月8日,據報道,微軟將會在未來提供Windows ARM版系統對于x64應用的支持。這一消息近日在微軟的博客中獲得了確認,并且微軟還表示Visual Studio Code也已經針對基于ARM的設備進行了更新和優化。...

關鍵字: Windows 微軟 ARM

技術子站

關閉
必威