Global Sources 世界經理人

廣告

如有投稿需求(暫不提供稿酬),請把文章發送到郵箱

[email protected],會有專人和您聯系

我知道了 立即投稿

熱點搜索
中國智造
工業4.0
智能制造
自動化技術
智能硬件
廣告
首頁    制造行業   中國制造業    正文

登陸云邊端,AI芯片產業打響全線戰爭

  腦極體  2020-05-22 00:00:00   海怪
對于AI行業,算法、算力和數據是三大基礎要素。

對于AI行業,算法、算力和數據是三大基礎要素。深度學習模型的不斷優化帶來的算法的成熟應用,5G網絡以及邊緣、終端的普及讓海量數據的獲取和傳輸變得唾手可得,而將算法和數據協調統一處理的算力資源就成為當前AI發展的關鍵制約因素了。

圖1 GPU

算力的提升在于芯片的性能是否得到飛躍。由于深度學習算法對芯片性能有著極為苛刻的效率要求和超高的并行計算要求,傳統的通用CPU在AI計算當中性價比極低。因此,適合于深度學習要求的海量并行計算和計算加速的AI芯片就成為當前AI巨頭們角力的賽場。

廣義上來說,包括像GPU、FPGA以及 ASIC(專用芯片)這些提供AI算力的芯片都可以稱之為AI芯片。按照任務劃分,AI芯片可以分為訓練芯片和推理芯片;按部署位置劃分,可以分為云端芯片、邊緣側和終端芯片。

其中,訓練芯片對算力、精度和通用性要求較高,一般部署在云端,多采用“CPU+加速芯片”這類異構計算模式;推理芯片更加注重綜合性能,更考慮算力耗能、延時、成本等因素,在云端和邊終端都可以部署。

云端AI芯片部署在公有云、私有云和混合云等大型數據中心,能滿足海量數據處理和大規模計算,可通過多處理器并行完成各類AI算法的計算和傳輸,具有通用性。邊終端AI芯片要求體積小、能耗少、性能略低,主要用于攝像頭、手機、邊緣服務器等終端設備中,滿足有限的AI能力。

從2016年谷歌TPU專用芯片大放異彩之后,AI芯片快速經歷了2017年資本涌入、巨頭紛至沓來,2018年新玩家爭相入局、初露崢嶸,2019年至今,AI芯片進入全面商用落地的激烈競爭格局當中。

按照Gartner數據,伴隨著全球AI產業的快速增長,未來5年,AI芯片仍然會以每年50%的速度增長。在過去的一年當中,AI芯片在云端、邊緣側以及終端領域都取得了明顯進展。

我們將通過梳理AI芯片在這三大細分市場的最新進展,來進入其行業縱深,找到AI芯片行業發展的最新動向。

新勢力入局,云端AI芯片的搶灘爭奪戰

在云端的數據中心,無論是深度學習的算法訓練還是推理服務,都繞不開英偉達的GPU產品。AI算法訓練的主要芯片配置是GPU+ASIC,全球主流的云端硬件平臺都在使用英偉達的GPU 進行加速。而在推理服務上,主要還是采用CPU+GPU的方式進行異構計算,這得益于GPU強大的并行計算能力、通用性以及成熟的開發環境,但GPU的高能耗和昂貴成本,也成為眾多云廠商的心中隱痛。

相比之下,FPGA的低延遲、低功耗、可編程性優勢和ASIC的特定優化和執行特定模型的效能優勢就非常突出了。因此,我們看到越來越多的云廠商和芯片廠商開始嘗試CPU+FPGA或CPU+ASIC 這樣的異構方式,推出更符合自身云端算力要求的AI芯片。

2019年4月,高通推出了面向數據中心推理計算的云端AI芯片Cloud AI 100,峰值性能超過350TOPS,與其他商用方案相比,每瓦特性能提升10倍。

而早先云服務巨頭亞馬遜也已推出了機器學習推理芯片AWS Inferentia,最高算力可以達到128 TOPS,在AI推理實例inf1可搭載16個Inferentia芯片,提供最高2000TOPS算力。

而在國內,阿里巴巴在去年9月推出自研架構和算法的AI推理芯片含光800,主要用于和電商業務相關的云端視覺場景,在RESNET50基準測試中獲得單芯片性能第一的成績。

華為則推出了全球最快的AI訓練集群Atlas900,集成了數千顆昇騰910芯片,總算力可以輸出256-1024 [email protected],相當于50萬臺PC計算能力的強勁算力。

去年底,騰訊投資的燧原科技推出面向云端數據中心的AI訓練加速卡云燧T10,單卡單精度算力達到20TFLOPS,可以為大中小型數據中心提供了單節點、單機柜、集群三種模式。此外,像寒武紀、比特大陸也在去年從細分市場進入云端AI芯片市場,試圖搶占一定的云端AI芯片的市場份額。

Gartner數據顯示,全球AI服務器及AI芯片市場規模自2016年到2020年都將保持持續的高速增長,而全球云端AI芯片當中GPU的市場份額卻呈現出持續下滑的趨勢,預計到2022年云端訓練GPU占比將降至60%,云端推理GPU占比更是只有30%。

這意味著云端AI芯片的專用芯片的市場規模將進一步擴大,新入局玩家們特別是云服務廠商的巨頭玩家們都會盡可能在自家的數據中心部署結合自身算法的AI芯片。

2020年,隨著高通、英特爾等芯片巨頭、AWS、阿里、華為等云廠商以及芯片初創公司產品的落地,云端AI芯片市場的競爭將更趨激烈,未來將進一步削弱英偉達的話語權。

從云端涌入的巨頭玩家,攪動邊緣AI芯片新戰場

隨著5G、自動駕駛、IoT等新技術普及和配套設備的海量涌現,接下來將為邊緣側AI芯片提供更大的發揮空間。特別是5G網絡的普及將帶來邊緣側數據處理方式的變革,為邊緣側AI的工作負載提供了更多需求。

邊緣計算正在被視為AI的下一個重要戰場,原有的在云端、終端都有所積累的廠商,都希望通過邊緣AI芯片的布局,完善云、邊緣、終端生態,打造一體化的計算格局。

早在2018年,谷歌就發布了用于邊緣推理的微型AI加速芯片——Edge TPU,專為企業在IoT設備中的機器學習任務而設計。在去年3月,谷歌還推出了千元級搭載Edge TPU芯片的開發板,可以加速硬件設備上的模型推理。

圖2 (谷歌Edge TPU開發板)
(谷歌Edge TPU開發板)

似乎為回應谷歌的這一挑戰,英偉達發布了面向嵌入式物聯網的邊緣計算設備Jetson Nano,適用于入門級網絡硬盤錄像機、家用機器人以及具備全面分析功能的智能網關等應用。而在去年11月,英偉達又發布了邊緣AI超級計算機Jetson Xavier NX,能夠在功耗10W的模式下提供最高14TOPS,在功耗15W模式下提供最高21 TOPS的性能,為更小尺寸、更低功耗的嵌入式邊緣計算設備提供了AI推理能力。

圖3 (英偉達Jetson Xa vier NX)
(英偉達Jetson Xavier NX)

同樣在去年底,寒武紀發布用于深度學習的SoC邊緣加速芯片思元220,采用臺積電16nm工藝,最大算力32TOPS,功耗控制在10W,支持Tensorflow、Caffe、mxnet以及pytorch等主流編程框架。根據其公布的數據,參數性能可以比肩英偉達去年發布的 Jetson 系統級模塊——AGX Xavier 和Jetson Xavier NX。

在去年7月的百度AI開發者大會,聯合三大運營商、中興、愛立信、英特爾等,發起百度AI邊緣計算行動計劃,旨在利用AI推理、函數計算、大數據處理和產業模型訓練,推動AI場景在邊緣計算的算力支撐和平臺支持,加速百度AI應用生態在5G、物聯網等新型場景下快速落地。

在自動駕駛這類專用邊緣場景上,AI芯片也出現加速勢頭。目前,由于自動駕駛算法仍在快速更迭和進化,大多自動駕駛芯片使用 GPU+FPGA 的解決方案。最典型的產品如英偉達的DRIVE PX系列及后續的Xavier、Pegasus系列等。在去年 CES上,英偉達推出了全球首款商用L2+自動駕駛系統NVIDIA DRIVE AutoPilot。DRIVE AutoPilot的核心就是Xavier系統級芯片,其處理器算力高達每秒30萬億次。

英特爾雖然入局自動駕駛芯片市場較晚,但通過一系列大筆收購,很快推出了完整的自動駕駛云到端的算力方案,包括英特爾凌動/至強+Mobileye EyeQ + Altera FPGA,其中,英特爾收購 Mobileye推出的 EyeQ5,可以支持 L4-L5 自動駕駛,預計在今年量產。

而在國內,國內初創企業如地平線、眼擎科技、寒武紀也都在積極參與。地平線去年正式宣布量產國內首款車規級AI芯片“征程二代”,采用臺積電28nm工藝,可提供超過4TOPS的等效算力,典型功耗僅2瓦,延遲少于100毫秒,多任務模式下可以同時運行超過60個分類任務,每秒鐘識別目標數超過2000個,面向車聯網對強實時響應的需求。

據預測,從2018年到2022年全球邊緣計算相關市場規模的年復合增長率將超過30%,到2022年,邊緣計算市場規模將超萬億,與云計算市場規模不相上下。正因為邊緣計算如此巨大的市場前景,國內外行業巨頭紛紛開始邊緣側AI芯片的布局。

對于殺入邊緣側的AI芯片巨頭而言,實現云-邊-端-網的多方協同,其中就必須要完成從云端到邊緣的端到端解決方案的布局。這一動作客觀上也加劇了邊緣側AI芯片的競爭態勢,為AI初創企業帶來更多的生存壓力。

性能功耗比拼:終端AI芯片的無限戰爭

移動端AI芯片市場目前主要是在智能手機上。為實現差異化競爭,各手機廠商都加入了AI功能的開發,通過在手機SoC芯片中加入AI引擎,調配現有計算單元來實現AI計算,或者直接加入AI協處理器來實現AI功能的運行。

智能手機作為一種多傳感器融合的綜合數據處理平臺,要求AI芯片具備通用性,能夠處理多類型任務能力。而智能手機又受制于電池容量大小和電池能量密度限制,AI芯片在追求算力的同時對功耗有著嚴格的限制。

目前主流廠商都開發專用的ASIC芯片或者是使用功耗較低的DSP作為AI處理單元。

圖4 AI芯片

根據一份最新的手機AI芯片排名,高通驍龍865、蘋果A13和華為麒麟990分列前三。

排在第一名的高通驍龍865,采用了全新的第五代AI Engine,可以實現高達每秒15 TOPS的運算,相比驍龍855提升了兩倍的運算能力。通過AI異構多核可編程架構的設計思路,集成了傳感器中樞,利用多種不同引擎協同完成AI任務,在精度和功耗之間取得平衡。

蘋果A13處理器,采用第二代7nm工藝,專為高性能和低功耗而量身定制,擁有85億個晶體管。其GPU為四核心設計,速度提升20%,功耗降低40%,也就是在性能大幅提升的前提下續航并沒有降低。

華為去年推出的麒麟990 5G的NPU,采用雙大核+微核的方式,其大核負責性能,微核擁有超低功耗,其中微核在人臉檢測的應用場景下,能耗比大核工作降低24倍。

根據信通院報告統計,2017年全球手機AI芯片市場規模3.7億美元,占據全球AI芯片市場的9.5%。預計2022年將達到38億美元,年復合增長率達到59%,未來五年有接近十倍的增長。而目前能夠在智能手機Soc芯片中取得領先位置的仍然只有高通、蘋果、華為、三星等少數玩家,雄厚的資金實力和海量的銷售規模,使得每家都愿意拿出真金白銀來投入到新一代的AI芯片研發上面,在芯片的性能和功耗平衡上面實現碾壓和趕超。

洗牌已至?AI芯片之戰才剛剛開始

有媒體分析,根據行業發展規律,AI芯片在經歷了短暫的資本狂歡和創業高峰之后,會在2020年之后,出現第一批出局者,開始行業的大洗牌。

這一結論自然具有一定的道理。由于AI芯片產業是一個高投入、長周期,依靠量產規模優勢才能艱難取勝的產業。同時由于AI技術發展迅猛,芯片的設計周期可能無法趕上算法的迭代周期,這很容易造成AI芯片從設計到落地,已經無法趕上當前的計算需求。

此外,在對成本和能耗極為敏感的移動終端,還需要特別關注AI芯片的計算效能,達到低功耗、小體積、開發簡易,這些都需要探索架構上的創新。

實際上,2019年有不少商用的AI芯片,已經開始面臨芯片難以落地的困境,原因多種多樣,比如芯片本身帶來的性能提升不夠有吸引力,芯片不適配應用的需求,易用性不高,選擇的行業難以突破等等。

圖5 AI

顯然,種種限制條件和不利因素會更有利于那些入局早、實力雄厚的芯片巨頭和互聯網巨頭,而對那些依靠融資存活的AI芯片初創企業們帶來巨大壓力。

但這并不意味著AI初創企業都會進入被洗的哪一陣營。除了少數巨頭把持的云端芯片市場、日趨頭部化的智能手機Soc芯片市場,未來AI芯片還將在智能家居、智能安防、自動駕駛等邊緣、終端上面有著巨大的市場空間,同時在醫療、教育、零售、交通等行業有著豐富的應用場景。當AI芯片的盤子足夠大的時候,多樣化生態仍然會保持一段時間。

當前全球AI芯片產業仍然處于產業化的早期階段,最新推出的AI芯片主要還是集中在專用芯片領域,AI芯片初創企業仍然可以在ASIC上取得獨有的優勢。例如在AI架構上的探索上面,國內的一些初創企業也已提出一些可以適用于多種算法需求、多種場景需求的全新架構?芍貥嫾軜嬕约按嫠阋惑w成為未來AI芯片實現性能突破的主要方向。

在未來,芯片的易用性、有效算力、能效比以及落地速度,都將成為影響AI芯片產品失敗與否的關鍵。在各個方面都持續做好迭代創新,才是考驗所有這些AI芯片玩家們能否在始終在場不掉隊的關鍵因素。

© 世界經理人:自1999年創立以來,世界經理人網站(www.118148.live)致力于引導職業經理人實現卓越管理,以專業的形象為經理人用戶全方位提供最佳管理資訊服務和互動平臺。

相關文章

新基建緣何5G打頭陣?

從5G到AI:麒麟990重構了什么

5G車聯網十大產業化趨勢

從5G入網爭議,到5G手機的差異化之路

AI、5G與國際貿易:變局中的語音芯片

廣告
 關注成功
 取消關注
廣告

熱門排行榜

  • 熱門
  • 經典
  • 管理
  • 文章
  • 論壇
  • 博客
 
 
 
資訊訂閱
世界經理人 iPhone APP
世界經理人 微信公眾號
全民欢乐捕鱼兑换码领取 _澳门百家乐策略 秒速赛车前五后五技巧 浙江6+1走势图2元网 网游赚钱排行 真钱赌场安卓版软件 安徽11选五走势图下截 小数定双码是什么生肖 炒股是你抑郁的开始 20选5预测专家燕 棋牌捕鱼游戏平台