平頭哥最新發布的5nm服務器芯片倚天710,基于ARM架構,但僅自用并不對外出售。業界分析,其難度和華為做麒麟芯片類似:“大家都是買ARM的IP,然后自研芯片,相當于你買了樂高的積木小塊,然后自己去搭,可以搭成房子,也可以搭成車子。”
文|《中國企業家》記者 劉哲銘
編輯|李薇
圖片來源|被訪者
不出所料,阿里巴巴帶來了一款ARM架構的服務器芯片。
2021年10月19日,云棲大會現場,阿里巴巴旗下半導體公司平頭哥發布自研云芯片倚天710,采用5nm(納米)工藝,單芯片容納高達600億晶體管;在芯片架構上,基于最新的ARMv9架構,內含128核CPU,主頻最高達到3.2GHz。
阿里表示,該芯片已于7月流片,性能超過業界標桿20%,能效比提升50%以上,“是業界性能最強的ARM服務器芯片”。而作為阿里第一顆為云而生的CPU芯片,倚天710將在阿里云數據中心部署應用。
阿里云智能總裁張建鋒表示,倚天710是阿里云推進“一云多芯”策略的重要一步,正如云上用戶不需關心服務器運維一樣,他們也不再需要關心芯片。
2018年4月,阿里巴巴全資收購大陸唯一擁有自主嵌入式CPU IP核的半導體公司中天微,并在數月后將達摩院芯片研發團隊與中天微團隊合并成立平頭哥半導體公司。這是阿里在芯片領域最早的動作。
三年間,平頭哥完成從發布首款RISC-V處理器玄鐵710、首款云端AI推理芯片含光800,到首款通用服務器芯片倚天710的“三級跳”,擁有處理器IP、AI芯片及通用芯片等產品系列。張建鋒透露,玄鐵CPU已出貨超25億顆,成為國內應用規模最大的國產CPU。
不過,張建鋒明確表示,新研發的倚天710芯片不出售,將在很長一段時間內自用。首款搭載倚天710的磐久服務器同時亮相云棲大會。但張建鋒同時也強調,阿里將繼續與英特爾、英偉達、AMD、ARM等合作伙伴保持密切合作,為客戶提供更多選擇。
在倚天710發布前一天,云棲C場館的達摩院展臺已經發出了信號:展臺從左到右擺著平頭哥曾經發布的芯片,包括人工智能芯片含光800等,再往后,則蓋著神秘紅布。隨后,有消息傳出,云棲大會上阿里云將發布5nm制程的ARM架構服務器芯片,該芯片于2019年開始研發。
隨著人工智能、云計算、物聯網等產業的發展,數據中心作為基礎設施的作用越來越舉足輕重。作為算力和數據的承載單元,服務器是數據中心最核心的硬件,而服務器采取的芯片又是其中關鍵。
“用ARM架構做服務器芯片是一個很好的方向,目前,英特爾的芯片依舊‘壟斷’著整個服務器芯片市場,采取x86架構,這也是英特爾最掙錢的部門。幾年前,大家開始說要用ARM架構來做服務器,阿里云每年這么大的業務量,完全可以做,降本增效。而且現在產業成熟了,時機到了。”一位前英特爾工程師對《中國企業家》表示。
阿里此舉也早就有跡可循。今年5月,阿里在北京召開云峰會,阿里云智能總裁張建鋒就表示,阿里云優化了自己的云操作系統飛天,使其同時兼容x86、ARM等多種芯片架構。其在采訪中提到,阿里云2021年的目標之一是要“做深基礎”,計劃今年開始陸續推出一系列核心的硬件結合軟件的產品,包括自有芯片。
不僅僅是阿里,國內外的云服務廠商們都在用實際行動表達對這條路徑的厚望。
2019年,華為通過旗下海思半導體自研芯片推出了基于ARM架構的7nm 64核服務器芯片“鯤鵬920”和服務器“泰山”,后因受制于來自美國的制裁,下一代“鯤鵬930”一直無法如期發布。國外,Amazon發布了第二代基于ARM架構的自主設計服務器芯片“Graviton2”;英偉達也發布了首款ARM架構服務器處理器Grace,面向AI、超算、數據中心等領域,將于2023年正式推出。
在一片熱鬧景象背后,很難繞開一個問題:為什么芯片公司和云廠商們都紛紛期待摘下ARM這顆芯片產業皇冠上的明珠?或許不僅僅是降本增效,而是ARM架構為服務器芯片帶來了推高行業天花板的可能性。
和蘋果做M1一個道理?
1978年6月8日,英特爾發布了新款16位微處理器“8086”,也同時開創了一個新時代:x86架構誕生了。憑借著x86,在服務器芯片市場,英特爾保持著絕對優勢。
據IDC此前發布的《全球服務器季度跟蹤報告》數據顯示,x86服務器產生的收入在2021年第二季度達到了214億美元,非x86服務器收入約為23億美元,x86市場占比超過90%。而在x86市場中,英特爾作為陣營龍頭,其服務器芯片也占據了近90%的份額。
在已成熟的技術路線上開辟另一種可能,不僅是一件耗成本的事,更是一件極長周期的事。2008年,ARM開始醞釀服務器芯片計劃,隨后乘著ARM 64的東風,高通、微軟、華為等開始逐步自研ARM服務器CPU,不過大多數入局者折戟沉沙。
前英特爾工程師認為,“垂直整合帶來的性能提升”是大家未曾放棄嘗試ARM的重要原因,“就和蘋果做自研基于ARM架構的芯片M1是一個道理。舉個例子,windows要在英特爾CPU上優化會比較困難,但是macOS在M1上優化就可以做到極致。自研芯片把這件事的天花板掌握在自己手里。”
雖然未曾有人明示,但始終有一種潛在的共識:有一天,人工智能模型會變得龐大,以至于今天的人工智能硬件架構不得不從頭開始,重新設計,而這一天或許會很快到來。
從英偉達的表述中也不難看到這一點,服務器芯片Grace基于未來的ARM Neoverse處理器架構,被設計為與Nvidia GPU極其緊密的耦合,消除了目前x86 CPU和加速器互聯中存在的任何“瓶頸”。
不僅如此,ARM架構正逐步在小型服務器中得以驗證。“之前大家或許對ARM有質疑,現在慢慢地正在獲得信任。”該工程師認為,“或許,ARM反超x86的時代將真正開啟。”
云棲大會同一天,蘋果發布最新版本MacBook Pro,MacBook Pro有兩個處理器選擇,分別是M1 Pro和M1 Max。無論哪種,都是在ARM架構上的重新定義。
對ARM的信心也正在影響著市場對英特爾的判斷。過去幾個月里,英特爾的股價一路下跌,而標普500指數則走向相反方向。有分析認為,雖然英特爾的營收已經連續10個季度超過市場預期,但投資者對該公司在關鍵業務領域缺乏進展感到失望,尤其是數據中心和客戶端計算業務,這兩項業務分別占該公司季度營收的30%和50%。
有人認為,英特爾服務器芯片目前總量很大,但隨著時間推移,ARM架構服務器芯片不斷成熟,英特爾很可能會丟失掉新的增量市場,“比如可能五年之后阿里自己的新增服務器、機房,就用自己的芯片”。
不過從阿里的對外表述來看,合作伙伴依舊重要,比起“垂直整合”,張建鋒更傾向于客戶需求。在發布倚天710后,張建鋒緊接著強調,“我們將繼續與英特爾、英偉達、AMD、ARM等合作伙伴保持密切合作,為客戶提供更多選擇。”
在隨后的采訪中,張建鋒更是強調:“未來,Core有極大的不確定性,你說一定是ARM還是x86,其實不確定,今天我們有能力去選擇一個更面向未來、符合生態的東西。而要不要切換是客戶的選擇,不是我的選擇,因為我的芯片最終是讓客戶來埋單,完全是市場化的東西。”
做成并不容易
2019年,ARM引入Neoverse產品線,并發布了Neoverse N1/E1核心IP,這是ARM第一次專門針對服務器產品推廣的處理器IP,亞馬遜的Graviton2以及英偉達的Grace都是基于該IP。DIGITIMES在今年3月發布的研究報告中提到:亞馬遜、微軟等云計算數據中心運營商以及Marvell、Ampere等芯片設計企業開始采用ARM架構。
據阿里方面介紹,倚天710采取ARM的公版授權,并非架構授權。團隊從平頭哥成立后開始逐步搭建,來自于行業中的很多公司,具備豐富的設計經驗。
針對這種做法,一位半導體從業者表示,其難度和華為做麒麟芯片其實是類似的:“今天大家都是買ARM的IP,然后自研芯片,從技術上來說,這種做法是有門檻的,但也不算極大創新。舉個例子,就相當于你買了樂高的積木小塊,然后你需要自己去搭,可以搭成房子,也可以搭成車子。”
但在張建鋒看來,這是阿里的第一塊5nm制程的服務器芯片,它的誕生充滿挑戰:
“首先,工藝跟設計要匹配,這是一個很大的技術挑戰;第二,我們將這么多先進的IP集成到一個SoC上面,很多IP其實沒有被驗證過的,因為別人開發出來,從來沒有在工藝上流過片,很多問題很多系統我們是第一家去做,所以我們要承擔更多的風險,解決更多的問題;第三,(在研發過程中)大規模的流片是多次,到目前為止是比較超預期的,這一次流片的東西回來大部分指標超出預期。”
“做ARM架構的服務器芯片都是重投入、長周期。能做出來、敢放在自己服務器上并且賣出去、用戶用起來不出問題,這才是挑戰所在,大家能看到的目標和路徑基本差不多,就看誰能實現。”一名芯片從業者表示。
這一點似乎也不用擔心,在阿里云的敘事里,技術與商業度正在愈發貼近。Canalys發布了中國云計算市場2021年第二季度報告,報告顯示阿里云、華為云、騰訊云和百度智能云分別以33.8%、19.3%、18.8%、7.8%的市占率位列前四名。
據TrendForce預測,至2023年前,以ARM架構為代表的RISC架構芯片仍難與x86抗衡。盡管ARM這條路徑也沒那么容易,但正如張建鋒所說,一切都是交由市場選擇。如果有新的技術變量出現,阿里云的選擇也將隨之變化。
12月4日至5日
2021(第二十屆)中國企業領袖年會
與相識20年的你
一起締造公司改變中國的力量
報名通道現已開啟
點擊下圖即可報名
值班編輯:周春林 審校:張格格 制作:崔允琰