• <s id="aiiqm"></s>
  • 
    
    • <sup id="aiiqm"></sup>
    • <sup id="aiiqm"></sup>
       

      終極AI加速器Imagination來了!性能高達600TOPS、兼低功耗

      發(fā)布時間:2020-11-16 08:49:17  |  來源:雷鋒網(wǎng)  

      曾經(jīng)統(tǒng)治手機GPU IP市場的Imagination,歷經(jīng)變動之后,目前在移動GPU IP市場占有率有36%,汽車GPU IP市占率43%。近來,Imagination近期發(fā)布的一系列新品不僅是其實力的展現(xiàn),也足以讓同行們增加對這位老對手的關(guān)注。

      11月13日,Imagination發(fā)布了耗時兩年研發(fā)的最新的第三代神經(jīng)網(wǎng)絡(luò)加速器(NNA)產(chǎn)品IMG Series4,其全新的多核架構(gòu)可提供600 TOPS(每秒萬億次操作)甚至更高的超高性能,主要面向先進駕駛輔助系統(tǒng)(ADAS)和自動駕駛應(yīng)用。

      以低功耗產(chǎn)品見長Imagination推出高性能的終極AI加速器,會給在自動駕駛汽車芯片市場占有領(lǐng)導(dǎo)地位的NVIDIA多大的沖擊?

      耗時兩年打造的終極AI加速器

      Imagination在AI火熱的2017年推出首代神經(jīng)網(wǎng)絡(luò)加速器(NNA)PowerVR 2NX,單核性能從1TOPS到4.1TOPS。緊接著,2018年P(guān)owerVR 3NX發(fā)布,單核性能從0.6TOPS到10TOPS,多核產(chǎn)品性能從20TOPS到160TOPS。

      性能增強的同時,Imagination的NNA主要面向的市場也從2NX時的移動設(shè)備和汽車市場,進一步拓展到智能相機監(jiān)控、消費電子(尤其是數(shù)字電視)、低功耗IoT智能設(shè)備領(lǐng)域。

      時隔兩年之后,Imagination才推出第三代NNA產(chǎn)品4NX。4NX系列的單核性能進一步提升,每個單核能以不到1瓦的功耗提供12.5TOPS的性能。相比前兩代NNA,新一代產(chǎn)品強調(diào)的是全新多核架構(gòu),這個新的多核架構(gòu)支持在多個內(nèi)核之間對工作負載進行靈活的分配和同步,從而實現(xiàn)更高性能。

      Imagination Technologies產(chǎn)品管理部門總監(jiān)Gilberto Rodriguez介紹:“我們的軟件提供了精細的控制能力,并通過對多個工作負載進行批處理、拆分和調(diào)度而提高了靈活性,可以在任意數(shù)量的內(nèi)核上使用。Series4可為每個集群配置 2個、4個、6個或者8個內(nèi)核。1個8內(nèi)核的集群可以提供100TOPS的算力,配有6個8核集群的解決方案就可以提供600 TOPS的算力。”

      據(jù)悉,在AI推理方面,Series4 NNA的性能比嵌入式GPU快20倍以上,比嵌入式CPU快1000倍。

      至于為什么要推出如此高性能的AI加速器,Gilberto Rodriguez表示,“ADAS和自動駕駛對芯片有很高的算力需求,比如L2+的駕駛員檢測或語音/手勢控制需要10TOPS的性能,L3-L4級別的自動駕駛有50-100TOPS的性能需求,L5級別的自動駕駛性能需求超過500TOPS。”

      “雖然市場上已經(jīng)有滿足自動駕駛需求的AI芯片,但功耗不夠理想。所以,我們花兩年時間去了解和評估客戶需求,基于我們的前兩代低功耗的產(chǎn)品,推出了高性能低功耗的4NX系列產(chǎn)品,并且將自動駕駛作為主打市場,也可以應(yīng)用于數(shù)據(jù)中心和桌面級GPU。” Imagination Technologies視覺和人工智能部門高級總監(jiān)Andrew Grant表示。

      600TOPS的高性能如何兼顧低功耗?

      需要指出的是,4NX系列的8內(nèi)核集群要實現(xiàn)100TOPS的性能,超過30 TOPS/Watt 的性能功耗比,以及超過12 TOPS/mm^2 的性能密度是要在5nm節(jié)點實現(xiàn)。

      Gilberto Rodriguez也提到,如果要用多個集群實現(xiàn)更高算力,Imagination可以提供多集群的協(xié)同機制,但也需要客戶在應(yīng)用層進行一些設(shè)計。

      多核靈活架構(gòu)帶來的可擴展性讓4NX可以實現(xiàn)高性能,但對于高性能芯片而言,功耗的控制也非常關(guān)鍵,特別是AI芯片。AI芯片需要處理大量的數(shù)據(jù),并且數(shù)據(jù)的搬運耗費的功耗遠大于數(shù)據(jù)處理,因此,高性能AI芯片必須想辦法盡量減少數(shù)據(jù)的搬運,同時降低延遲和節(jié)省帶寬。

      對于延遲的降低,Imagination采用的方法是單核組成2核、4核、6核或8核的多核集群中,所有內(nèi)核可以相互協(xié)作,并行處理一個任務(wù),降低處理延遲,縮短響應(yīng)時間。當然,集群中和多核既可以共同執(zhí)行一個批處理任務(wù),也可以分別運行各自不同的網(wǎng)絡(luò),也就是各個內(nèi)核能夠獨立運行。

      4NX更大的亮點在于其節(jié)省帶寬的Tensor Tiling( Imagination’s Tensor Tiling,ITT)技術(shù),這是Imagination正在申請專利的技術(shù),也是4系列中新增的功能。Tensor Tiling技術(shù)利用本地數(shù)據(jù)的依賴性將中間數(shù)據(jù)保存在片上存儲器中,最大限度地減少將數(shù)據(jù)傳輸至外部存儲器,相比上代產(chǎn)品,將帶寬降低多達90%。

      具體而言,神經(jīng)網(wǎng)絡(luò)的多層以融合內(nèi)核的形式運行在加速器的硬件流水線里,融合內(nèi)核之間的特征圖(Feature Map)需要通過外部存儲進行交換。Tiling技術(shù)是充分利用緊耦合的 SRAM 來融合更多的層,更多的層被融合之后,就減少了需要通過外部存儲交換的特征圖,進而達到提升效率,節(jié)省帶寬的目的。

      還需要說明一下Tensor Tiling技術(shù)中的批處理和拆分,批處理是分配適合批處理的大量的小型網(wǎng)絡(luò)任務(wù)到每個獨立工作的NNA單核,能夠提升并行處理能力。拆分則是任務(wù)在多個維度被拆分,所有NNA單核共同執(zhí)行一個推理任務(wù),減少網(wǎng)絡(luò)推理延遲的同時,在理想情況下協(xié)同并行處理的吞吐量與獨立并發(fā)處理的相同,非常適合網(wǎng)絡(luò)層很大的網(wǎng)絡(luò)。

      當然,Tensor Tiling的拆分是通過Imagination提供的編譯器來完成,不需要開發(fā)者手動完成,并且利用NNA的性能分析工具能夠?qū)I任務(wù)進行更好地調(diào)度和分配。

      那Tensor Tiling在節(jié)省帶寬的同時能否減少數(shù)據(jù)的搬移?Gilberto Rodriguez表示,“答案是肯定的。一方面,Tensor Tiling讓待處理數(shù)據(jù)通過內(nèi)存帶寬的傳輸減少,另一方面,重復(fù)利用的神經(jīng)網(wǎng)絡(luò)權(quán)重給處理器核的傳輸次數(shù)也減少,這讓就可以有效減少數(shù)據(jù)搬運。”

      硬件上層的工具鏈方面,Imagination的離線和在線工具組成的工作流程可以讓開發(fā)者更快實現(xiàn)部署。

      NVIDIA在自動駕駛領(lǐng)域?qū)⒂瓉硇聦κ?

      NVIDIA在2015年就推出了車載計算平臺,此后持續(xù)迭代,目前在自動駕駛芯片市場已經(jīng)處于優(yōu)勢地位。不過,擅長桌面級GPU的NVIDIA能夠提供高性能,但功耗可能對于電池供電的電動汽車不夠友好。這也是在對功耗要求比較嚴格的移動端有優(yōu)勢的Imagination的機會所在。

      與NVIDIA有所不同,Imagination是IP提供商,并不會直接提供芯片。因此,Imagination可以與領(lǐng)先的汽車行業(yè)顛覆者、一級供應(yīng)商、整車廠(OEM)和汽車系統(tǒng)級芯片(SoC)廠商合作,推出有競爭力的產(chǎn)品。為了幫助合作伙伴更好進入這一市場更快推出車規(guī)級產(chǎn)品,此次推出的NX4還包含IP級別的安全功能且設(shè)計流程符合ISO 26262標準。ISO 26262是旨在解決汽車電子產(chǎn)品風險的行業(yè)安全標準。

      新推出的4系列NNA可以在不影響性能的情況下,安全地進行神經(jīng)網(wǎng)絡(luò)推理。硬件安全機制可以保護編譯后的網(wǎng)絡(luò)、網(wǎng)絡(luò)的執(zhí)行和數(shù)據(jù)處理管道。

      Andrew Grant透露,已經(jīng)開始提供授權(quán),并將于2020年12月在市場上全面供應(yīng)。授權(quán)的客戶目前已經(jīng)不止一家。

      這就意味著,自動駕駛芯片市場將會迎來更多有競爭力的產(chǎn)品。雷鋒網(wǎng)認為,Imagination更強的GPU和NNA產(chǎn)品組合將會幫助更多想要進入這一市場的公司推出更有競爭力的產(chǎn)品。上個月,Imagination發(fā)布了最新一代的IMG B系列高性能GPU IP,這款多核架構(gòu)GPU IP 4個系列內(nèi)核有33種配置。

      更通用的GPU和更專用的AI加速器,顯然可以給高性能計算帶來更多的選擇。有意思的是,NVIDIA目前也擁有性能強勁的GPU和AI加速Tensor Core的組合。

      ABI Research預(yù)計,到2027年左右,對ADAS的需求將增長兩倍,但汽車行業(yè)已然將目光投向了更遠的全自動駕駛汽車和自動駕駛出租車,從L2和L3級ADAS向L4和L5級全自動駕駛演進的過程中,高性能、低延遲和高能效的結(jié)合將是關(guān)鍵所在。

      巨大的市場機會之下,兩家芯片產(chǎn)品優(yōu)勢類似的公司,會如何競爭?

      關(guān)鍵詞:

       

      關(guān)于我們 - 聯(lián)系我們 - 版權(quán)聲明 - 招聘信息 - 友鏈交換

      2014-2020  電腦商網(wǎng) 版權(quán)所有. All Rights Reserved.

      備案號:京ICP備2022022245號-1 未經(jīng)過本站允許,請勿將本站內(nèi)容傳播或復(fù)制.

      聯(lián)系我們:435 226 40@qq.com

      国内精品一区视频在线播放,嫩草影视在线观看,天天久久狠狠伊人第一麻豆,波多野结衣视频免费看
    • <s id="aiiqm"></s>
    • 
      
      • <sup id="aiiqm"></sup>
      • <sup id="aiiqm"></sup>
        主站蜘蛛池模板: 大学寝室沈樵无删减| 青青草中文字幕| 波多野结衣69| 天天曰天天干天天操| 国产成人午夜高潮毛片| 亚洲av无码码潮喷在线观看 | 国产在线精品国自产拍影院同性 | a级毛片免费观看网站| 真实的国产乱xxxx在线播放 | 美女网站色在线观看| 手机在线观看一级午夜片| 国产69精品久久久久777| 亚洲人成亚洲人成在线观看| eeuss影院天堂影院| 野花视频www高清| 日本在线免费看片| 国产91在线视频| 一本久道久久综合狠狠躁av| 精品人妻系列无码天堂| 日本理论片午午伦夜理片2021| 国产你懂的在线观看| 乱码在线中文字幕加勒比| AV天堂午夜精品一区| 波多野结衣的av一区二区三区| 国产高中生粉嫩无套第一次| 免费看特级淫片日本| A级毛片内射免费视频| 欧美毛多水多肥妇| 够够了太深了h1v3| 四虎影院最新网址| 久久国产乱子伦免费精品| 蜜桃成熟时3之蜜桃仙子电影| 最近免费中文字幕大全免费版视频 | 在线观看日韩一区| 伺候情侣主vk| 5060在线观看| 男男动漫全程肉无删减彩漫| 多毛bgmbgmbgm胖在线| 亚洲乱码精品久久久久..| 香蕉视频一区二区三区| 欧美va在线观看|