龍芯LA664性能(néng)追平AMD Zen3

 信創資訊     |      2022-06-07 15:45:33    |      中芯教育

日前,龍芯發布了龍芯3C5000服務器處理器,并聯合生态夥伴共同發布新一代國産服務器基礎軟硬件平台。這次發布會有兩個亮點,一是3C5000處理器,二是3A6000仿真成(chéng)績。

圖片

龍芯3C5000彌補服務器不足

過去,龍芯一直緻力于提升單核性能(néng),沒有盲目去堆核心數量。這種穩紮穩打的做法使龍芯在過去10年中IPC提升了3-4倍,在桌面(miàn)CPU上成(chéng)效立竿見影。

圖片

但在服務CPU上,由于國内ARM CPU往往采用“堆核戰術”,也就(jiù)是用64核、128核堆出一款服務器CPU,這導緻龍芯的四核CPU雖然在單核性能(néng)上更好(hǎo),但在多核性能(néng)上不如ARM CPU。這使龍芯在服務器CPU市場競争中處于不利地位。

3C5000是龍芯第一款16CPU,采用完全自主的LoongArch指令架構,16核心單芯片unixbench分值9500以上,雙精度計算能(néng)力達560GFlops16核處理器峰值性能(néng)與典型ARM 64核處理器的峰值性能(néng)相當,并支持最高16路互連,搭配新一代龍芯7A2000橋片,PCIe吞吐帶寬比上一代提升400%以上。就(jiù)SPEC2006測試來看,單核定點浮點Base分均大于10/G,單芯片分值超過200。可滿足通用計算、大型數據中心、雲計算中心的計算需求。該處理器通過芯片級安全機制可爲等保2.0、可信計算、國密算法替代、網絡安全漏洞防護等提供CPU級内生支持。

3C5000最大特點是單核性能(néng)強,特别是unixbench這種看重單核核内存性能(néng),多核加速比很低的測試,龍芯隻用16核就(jiù)能(néng)跑到9500,某ARM CPU即便有64核也跑不到這個成(chéng)績。從公開的數據來看,3C5000的性能(néng)在信創市場足夠用了,而且16核的核心是使其部署比較靈活。另外,龍芯還會有3D5000,也就(jiù)是把兩個3C5000封裝到一起(qǐ)的膠水32核芯片,主要針對一些對性能(néng)有更高要求的場景。

圖片

圖片

圖片

圖片

圖片

圖片

龍芯3A6000 IPC追平Zen3

相對于3C5000,鐵流認爲3A6000更加值得關注。相對于一些技術引進CPU在引進海外技術後CPU IPC增長緩慢,性能(néng)提高基本依靠購買更好(hǎo)的EDA工具和買台積電更好(hǎo)的工藝。龍芯一直緻力于提升CPU微結構設計水平來提升CPU的性能(néng)。CPUIPC在過去10年中提升了3-4倍,這使龍芯可以在制造工藝上落後技術引進的某ARM CPU一代的情況下,依然可以依靠CPU微結構設計水平做到性能(néng)持平或略優于技術引進的某ARM CPU。當龍芯與引進的某ARM CPU采用相同工藝時,龍芯可以憑借其IPC上的優勢在性能(néng)上領先某ARM CPU

圖片

圖片


3A6000和3A5000采用相同制造工藝,龍芯依靠其設計能(néng)力把CPU性能(néng)大幅提升。從仿真成(chéng)績看,定點相對于3A5000提升30%,浮點相對于3A5000提升60%這種提升是非常駭人的——如果仿真成(chéng)績與最終成(chéng)績相當,那麽,3A6000 SPEC06單核定點Base分大于13/G,浮點Base分大于16/G如果3A50002.5G2.8G,那麽,3A6000的 SPEC06單核定點Base分大于35,浮點將(jiāng)大于45這個性能(néng)對于信創和日常使用而言都(dōu)已經明顯過剩了。

圖片

(gcc,1165G7測試過程的頻率大約是 4.2GHz,換算IPC 13.3/G。下圖5600G的編譯參數和1165G7基本是一樣的。感謝guee幫忙測試)

圖片

gcc,int_base 48.6。測試過程中頻率基本保持在 4GHz,也就(jiù)是說 IPC 爲12/G,由于測試還有調優空間,及5600G的緩存要比5600X少一半,可以認爲調優後的Zen3可以達到13/G


作爲參照,11代酷睿的IPC大約是定點13+/G12代酷睿IPC大約是定點15+/GZen3IPC大約是定點13/G,龍芯LA664能(néng)夠達到定點13/G,浮點16/G,這已經追平或接近Zen311代酷睿。

當下,在同頻性能(néng)上追平11代酷睿和Zen3已經很不錯了,唯一的問題就(jiù)在于主頻了。當龍芯把7000系列把工藝換成(chéng)5/7nm就(jiù)可以把主頻做到3G以上,可以實現 SPEC06單核定點Base分大于40,浮點Base分大于50這種性能(néng)已經達到英特爾、AMD市場主流水平,即便龍芯平台移植了3A大型遊戲,龍芯7000系列CPU也足以應對。

結語

經過20多年的磨砺,龍芯終于把LA664提升到11代酷睿和Zen3的水平。LA664不僅超越了現有技術引進的ARM CPU,還超越了某些ARM CPU廠商PPT上的下一代CPU核。即便是當下國内首屈一指的海光,如果不把CPU IPC提升30%以上,面(miàn)對LA664也要敗下陣來。

回溯曆史,在10年前,龍芯的IPC是不如技術引進CPU的,某技術引進ARM CPUIPC是當時龍芯的2倍左右。然後,技術引進是存在代價和陷阱的,往往是知其然不知其所以然,進而導緻發展後勁不足。

相比之下,自主研發雖然在起(qǐ)步階段慢一些,苦一些,累一些,無法像技術引進CPU那要快速拿出産品,但自主研發發展後勁更足,這一點從龍芯過去10年的發展就(jiù)能(néng)看出來。

龍芯的性能(néng)已經不再是應用的障礙,唯一的障礙是軟件生态。期待龍芯能(néng)以應用爲階梯,在合作夥伴的幫助下循序漸進構建可以與Wintel、AA體系相媲美的自主技術體系。



分享上面(miàn)的二維碼給朋友,即可直達此頁!