終端、軟硬一體、異構計算、深度學習、神經網絡,它們將成為自 2020 年起,眾 AI 芯片企業制勝未來第四次工業革命的起點和未來法寶。如何改變碎片化的終端,如何通過軟硬件結合來提升算力,如何使用深度學習來更好地服務未來場景,這幾個問題成為了大名湖畔一群行家里手思考的關鍵。我們來看看他們思考后作出了怎樣的回答。
撰文 | 晏清
2000 年起,弱人工智能站了起來,跑向下一個階段2040 年強人工智能。
20 年后,以人工智能為驅動力,由「自動化」轉變為「智能化」的第四次工業革命。
而這一切都離不開人工智能三要素:算力、算法、深度學習的進步。
1 第四工業革命到來,算力先行
基于算力,在面對現如今碎片化的發展,AI 芯片廠商們無疑都知道該采取點不一樣的措施了:
Arm 中國:「在有限的運力上,讓所有平臺都可以發揮出來的一套軟件」
有兩個問題十分關鍵效能或訴求不同帶來的三端分裂,和終端的碎片化
根據以上兩點,Arm 中國產品研發副總裁劉澍認為,由不同的訴求,導致的相互間被割裂的云端、終端,以及中間的區域性服務本就是在一根鏈條上,盡管這種「碎片化」在終端上體現尤甚。
Arm 中國產品研發副總裁劉澍分享關于智能未來的思考
當算力平臺在云端和終端分布不同時,就會帶來對形態的思考,「不同的運算需求,怎么在算力模塊上提供不同的形態呢?」劉澍在演講的過程中既是向在座的觀眾發問,也是 Arm 中國對自己的算力支撐發問。是像過去一樣讓云端和終端完全分離,還是通過何種方式融合、互補?
針對以上問題,Arm 中國認為,「從算法和軟件角度來說,任何一個設備都可以幫助我們鏈接到整個人工智能的鏈條上,都能夠進行數據處理,并且都能夠進行兼容式的網絡數據處理,這個是我們看到的一個非常重要的發展思路。」
硬件和軟件的結合必定未來計算發展的必由之路。因此,在上游,放棄過去的云端發展思維,接受異構技術形態成為 AI 加速器主流的現狀,放棄一味地追求通用計算,才能更好地幫助通用方法降落在終端。
在通用計算和專用計算按一定比例共存的明天,希望有一種軟件架構可以把 CPU、GPU,乃至于 TPU、NPU 等幾部分統一起來,用統一的軟件編程行為將碎片化的市場黏合,將為整個業界的云端互通提供很好的業界遷移效果。
Arm 中國愿意做的,就是在計較成本的前提下,為市場盡可能開放選擇:針對自己的需求,讓大家根據場景來選擇合適的計算平臺模塊。
他們提出了一個具體的產品概念,也就是周易:智能計算機平臺。把絕大部分系統都會選擇的 CPU、GPU、NPU、VPU 都集合在一起,當軟件把算法、網絡分配在這些不同的算力的模塊上,實現效能的提升。
全志:如何在 SoC 中解決內部交互問題是關鍵
異構計算成為人工智能的形態主流,是業界達成的共識。全志認為,處在一個 SoC 中,全部計算單元共享一個系統全部資源的形式,即 AP SoC,是他們縱觀以前行業的發展,發掘出的最理想的載體。
作為 SoC 廠商,要在適應未來長期存在的接口池(Interface Repository,IR)撕裂的現狀,同時計劃在未來,將注意力集中在終端,在 SoC 中集中解決內部交互問題,實現系統內互聯的效果。例如研究內部數據轉化的機制,運用 SoC 抽象層預測并調配 OP 及內存交互單元,屏蔽底層硬件的差異,使開發者更加專注于模型的開發。通過這樣的方式合理調配不同計算單元的算度并配合起來,成為當下的高效應用。
耐能:終端 AI 網絡去中心化,達到算力共享。
致力于在終端推理芯片市場,以客戶為中心,生產高性能、低成本芯片產品的耐能認為:建立終端網絡,首先要做的是「去中心化」,來達到算力共享。
數十億傳感器的數據傳輸,會為云端帶來運算處理壓力。同時,實時識別、寬帶傳輸壓力,隱私安全等問題亟待被解決。這時最需要的就是終端,而可重構性成為終端網絡的關鍵。耐能將通過極高的 MAC 利用率實現尺寸與功耗的最小化。
知存:存算一體方案為 AI 芯片打破數據搬運帶來的運算瓶頸。
將存儲和計算結合在一起,是知存對由數據搬運導致的運算瓶頸做出的最直接的技術選擇。
作為國內最早接觸存算一體技術的團隊,他們打破常規計算架構,采用新的方式:直接用 ROM 單元,把需要的神經網絡、所有的參數都存儲在 RAM 單元當中,只需把被處理的語音結構存儲到神經網絡當中,最終輸出。效率將由此大幅提高,并且可以降低整個系統的成本。
未來他們還會針對存算一體帶來的特定摩爾定律進行開發,爭取在 28nm 芯片上達成存算一體技術。
而針對算法,知存、曠視、科大訊飛、引力互聯分別發表了不同的見解:
知存和曠視同時提到了一個詞「降噪」。
知存的算法還在合作開發中。針對語音識別業務,他們已經看到市場在選擇采用深度學習算法制作「噪音抑制劑」,而降噪識別是算法的一個重點,對算力有非常高的要求。目前,只有手機的電池設備才可以采用這樣的算法。
曠視展示神經網絡降噪視覺效果
曠視自 2017 年進入手機市場后,順應 5G 時代的到來,在今年和 OPPO Reno 合作推出首發的夜視算法全球首款神經網絡降噪。經過在影像處理前,讓圖像數據進入神經網絡進行降噪處理,然后再經過傳統處理方式,使圖片獲得更加「干凈」和「平衡」的視覺效果。
曠視認定算法不可能獨立運行,一定要跟硬件匹配。他們認為交互、運算和網絡,會是今后人工智能三大落腳點。
科大訊飛認為算法本身的改進是由深度神經網絡開始,其次是大數據,而第三點就是芯片產商們的努力,產品的迅速迭代促使算力不斷提升。
引力互聯看好邊緣計算市場,邊緣計算場景對實時性,對安全性要求低,甚至不需要聯網,需要更高效的邊緣計算速度,這樣的場景的需要,也會刺激大量邊緣計算芯片的需求。
最后我們來看看深度學習。
百度飛槳產品經理趙喬向大家分析深度學習平臺是未來的選擇
百度飛槳 PaddlePaddle 作為國內唯一一家功能齊全的開發平臺,認為深度學習平臺是智能時代選擇的工作系統。
以早期的 OCR 技術舉例,深度學習將大量人工、手工的費時特征處理操作,簡化為僅僅是檢測和識別兩個步驟。從技術和產業互聯的角度,百度觀察并意識到,深度學習的優勢在于隨著數據量的線性增長,性能也隨之線性增長,因此在大數據模型開發當中,深度學習具有非常明顯的優勢。
深度學習框架開發的模型越來越多,AI 產業的生態將以此為核心,將算法開發者、平臺使用者和相關的伙伴一起包裹進人工智能智能產業。開源自研的深度學習框架 PaddlePaddle 是一套整體的方案架構,采取的是端到端 AI 部署方案,提供多端多平臺服務,例如 Paddle Lite 就是針對移動端和嵌入式終端同時提供服務的推理引擎,目前最新的 Paddle Lite 2.0 提供更高性能的端側推理能力。
2 讓AI降落
如都教授所說,發跡階段的弱人工智能主要在做一件事,語音識別;而進入強人工智能時代,下一步要集中發力的則是視覺處理。
在這兩個垂直領域,曠視與科大訊飛這兩個產業先導,也表達出他們對于芯片產業的觀察和思考:
曠視:
手機是 AI 芯片出現最多的地方。自 2017 年起,兩年內曠視獲得了超過 75% 的手機市場占有率。根據 5G,他們對手機芯片做出了如下預測:
1)手機中的傳感芯片將與屏幕相結合,相機也會在未來與屏幕結合;
2)本地的計算,人機的交互,輸入與輸出,不會隨著終端產品的形式改變而發生改變。
他們能明顯感覺到,手機一線芯片正在加速人工智能化。從傳感端到攝像頭,加之人工智能化的存儲,手機現有的形態消失,轉變成一種可穿戴的人機交互設備,也未嘗是難以想象的未來可能。
科大訊飛:
人工智能技術的載體就是芯片。芯片分布在大大小小的物聯網設備中,由物聯網連接起來,必產生強大的勢能。
關于 AI 的計算架構,他們認為同時存在實時、可靠、用戶隱私安全的三大挑戰。他們認為,不論是人臉識別、圖像處理,還是語音識別,本地端處理的方式會是更加實時、可靠、安全的選擇,分布式混合框架在未來應該得到廣泛應用。因此本地 AI芯片將要面對分布式混合框架的高性能、低功耗、可聯網的三大要求,并努力做到軟硬件的深度結合。
而除了語音識別、視覺處理這兩個垂直領域的應用理解,現場更是分享了豐富的,基于行業場景的 AI 落地案例:
圖片來自于百度 PaddlePaddle 網絡宣傳視頻
百度飛槳通過一個現場演示視頻,講述了百度 PaddlePaddle 是如何幫助廣大開發者將 AI 技術落地于不同行業場景的:
國家電網的變電站工作人員,用代碼制造出無人巡檢機器人;
工廠的設備工程師,利用大數據模型,將噪音轉變為探測機器健康的診斷工具;
農業開發團隊利用深度學習,為一個村子的農民提供實時有效的生產指導建議;
工廠將配料方法和 30 多年的寶貴專業經驗轉化為模型,指導未來的生產。
PaddlePaddle 用以上幾個實例證明了深度學習平臺可以切實服務于社會需要的方方面面,而這樣子的例子在未來也許還會更多。
谷歌全球開發專家武強博士向我們展示智能交通控制系統
谷歌智能交通控制,基于國內交通擁堵造成的 2500 億損失產生了思考,并用深度強化學習、邊緣計算,以及多智能體,創造出一個盡可能沒有交通資源浪費的社會前景。
通過將各個路口的紅綠燈利用起來,互相形成通信協議,創造出一個多智能體;在多智能體與現實環境的交互中,不斷通過獎勵機制訓練,達到深度強化學習,利用深度強化學習算法對交通流量進行預測分析,由此改變紅綠的時長,使不夠智能的交通信號機制也變得「智能」起來。而選擇邊緣計算而非云端,則會更加實時、高效,更有助于緩解現實的交通壓力。
谷歌讓我們設想,一輛爭分奪秒的救護車,能夠一路綠燈地暢行在毫無擁堵的馬路上,我們期待這個場景到來的那天。
西井科技向在場觀眾展示「WellOcean」智慧港口
我們都知道西井科技的產品核心是無人駕駛,但誰又能想到是駕駛在無人的智慧港口里呢?
人工智能引起的工業革命洋流首先襲向港口。無人化作業是他們思考后得出的第一個結論,于是 WellOcean 作為智慧港口解決方案出現,使新的、智能化的港口從人員的數量、種類進行簡化,讓曾今熙熙攘攘的碼頭變得安靜有序。將原來超過 98% 需要人來完成的作業,用遠程自動化智能工具替代完成,既降低了港口和客戶的成本,又提升效率,同時降低了安全事故發生的概率。如此科技,西井去年發布的首款全時無人駕駛重卡 Q-truck 才能高精度無阻、暢快地跑在無人的智慧碼頭上。
另外,通過技術提升前線人員的工作效率是他們的新方向。只需要 14 個攝像頭就可以完成集裝箱信息、車輛信息采集,指導岸橋對準作業箱上船的全過程。讓 24 小時三班倒,8 小時內每 2 分鐘就疲于盯梢的工作人員放松了緊繃的神經。基于時間和人力的成本縮減達到以往成本的 80%,卻幫助客戶提升了 3 倍的效率。
他們專注于將自己的技術與場景的結合,期待他們在未來創造出更多更具體的價值。
3 讓AI更活躍
安創加速器副總裁英語霏為大家分享產業生態建設心得
產業系統的良性發展離不開好的產業生態建設。
安創加速器成功孵化出估值 30 億美元的 AI 獨角獸企業「地平線」,也在此分享了他們作為世界嵌入式移動芯片領域主導者,以及作為 AIOT 產業的創新創業服務平臺,為芯片產業生態的建設所作出的貢獻:
經過多年實踐,安創形成了自己的核心服務體系:項目加速、大企業創新、城市創新和跨境創新。
尤其值得一提的是,在項目加速過程中,他們基于安創成長營,成功打造了一個從核心的芯片、傳感器、算法構建的基礎,到人工智能、物聯網核心模塊等平臺層,再到最上層垂直領域例如交通、醫療、家居、工業等應用的產業閉環。通過這種方式,賦予創業型企業活力,以及獲得由資源對接帶來的強推動力。
安創加速器副總裁英語霏告訴大家:「已成功加速了七期企業,項目總量達到 115 個,其中 33% 是 AI 項目,共計 38 個,AI 芯片項目 13 個。這個比例可以說在硬科技的創業加速平臺中算是比較大的份額了。」
之后,安創還會繼續努力為中國本土創新企業提供硬科技技術支持、資金支持或甄選建議,以及創業經驗借鑒;也將繼續幫助如中國移動、華潤、紅豆集團、寶馬等離技術上游遙遠的大企業快速匹配資源,實現大企業創新;更會幫助海外的創業公司搭建起中國「本地化」的橋梁,目前中英創新項目中的 4 家企業已成功落地中國。
如此引來送往,形成商業和產業的良性合作。英語霏女士說:「我們始終認為,商業的核心還是要把生意做起來,這才是良性的商業環境。」
產業中的社群也需要刻意地去建立與維護:
百度飛槳是國內唯一功能齊全并開放的開發平臺,最大的目標還是要發展生態。不單是為了滿足金融、航空航天、軍工、政府等企事業單位自主可控等關鍵技術目標的實現,更要努力改變整個產業界使用 TensorFlow、Pytorch 等國外的框架來進行應用開發的主流現狀。
這就需要人為地開發并培養未來的用戶,以及培養未來用戶的使用習慣。
2018 年正式更名為「飛槳」之時,開發用戶將近一百萬。并從這一年開始,百度開始和 40 多所高校展開合作,這之中包括北航,設立人工智能專門課程和培訓,明年有望向本科生開發深度學習課程;在用戶企業中開放成長計劃,進行實戰訓練;同時還在網站上線視頻課程,在教育領域尋找產業合作。
一切為的是降低國內開發者使用深度學習的門檻。而就平臺本身,他們更加開放,將百度自己在國際領域打標得到的模型也分享出來。新的學習,如聯邦學習等,也同樣會有新的代碼放出來便于開發者使用,進一步降低大家的開發成本。
具有同樣想法的還有引力互聯的開發者平臺 Model Play。Model Play 平臺已在手機端上線,更加便于使用者隨時登陸、開發和共享,希望所有人可以很輕松進入門檻學習 AI,而未來的人工智能由在座的產業人士和未來的開發者一起去定義。
相信在即將到來的二十年里,國內 AI 芯片產業,面對新工業革命挑戰,迎頭直上,有備無患。