導讀:在人們討論國內人工智能領域的熱點話題時,也有不少挑戰(zhàn)與隱憂困擾著眾多參與者
說到科技,我們首先會聯想到的就是5G、大數據、萬物互聯和人工智能等熱詞。不可否認的是,人工智能是這些新興信息技術中的“當紅炸子雞”,更是未來產業(yè)、社會甚至國力發(fā)展的“底氣”所在。
值得欣喜的是,國內人工智能領域近年來取得了不少新的突破和成績,在近期有關部門發(fā)布的《2020人工智能中國專利技術分析報告》中可以看到,截至2020年10月,中國人工智能專利申請量累計已達69.4萬余件,同比增長56.3 %;IDC相關調研報告中,對2020年全球各國AI計算的發(fā)展水平統計后發(fā)現,中國人工智能服務器占全球市場三分之一左右,成為全球人工智能產業(yè)發(fā)展的中堅力量;而全球知名AI計算基準評測組織MLPerf在去年底也公布了一份“2020年推理測試榜單”,中國科技企業(yè)的產品創(chuàng)造了18項全球性能紀錄……
但是,在人們討論國內人工智能領域的熱點話題時,也有不少挑戰(zhàn)與隱憂困擾著眾多參與者,尤其是AI應用及落地的進程中,痛點與焦慮也隨之出現,如果歸納總結一下,可以聚焦為這三個問題:
1.如何解決AI算力匱乏與成本高企的矛盾?
2.能否打造類似水電供給的AI算力基礎設施?
3.如何協同行業(yè)在AI應用落地過程中迎接“產業(yè)AI化”大潮?
破局,無疑要從滿足行業(yè)需求以及夯實發(fā)展基礎做起。
爆發(fā)的需求和“暴漲”的壓力
無產業(yè)不AI,無企業(yè)不AI——人工智能已經迅速滲透到各行各業(yè)的發(fā)展建設中,這已經是不爭的事實。
但是,太多問題也隨之而來:簡單點兒說就是各行各業(yè)對AI需求的“胃口”越來越大,但是AI能力的供給匱乏,而成本卻在“暴漲”。這正是AI在供需層面的痛點與矛盾。
關于需求的變化有兩點值得注意:一方面是量的增長,另一方面是質的變化。
IDC在2020年6月至8月期間,針對中國企業(yè)人工智能應用需求開展了一項專題調查和研究。調研發(fā)現,企業(yè)對于人工智能帶來的價值有了更深的認知,企業(yè)在人工智能應用上正在采取更多積極的舉措。
在作者看來,這其中最大的變化就體現在人工智能新的應用場景嘗試上,即除了已經得到多個行業(yè)驗證的通用場景之外,不同行業(yè)的用戶還在根據自身的行業(yè)特性在進行積極嘗試,開辟一些新的碎片化應用場景。
數據顯示有超過九成的企業(yè)正在使用或計劃在未來三年內使用人工智能,其中,大部分企業(yè)采用了公有云、私有云加本地部署的混合架構來部署人工智能應用,而74.5%的企業(yè)期望在未來可以采用具備公用設施意義的人工智能新型基礎設施。請注意:這一期望也是不同地區(qū)和不同規(guī)模的企業(yè)的共識。
除了量的變化,AI算力方面的質變則更令人關注。
提到質變,首先要談一下AI模型。這其中,最具代表性的就是打敗李世石的Alpha GO,以及OpenAI實驗室去年推出的GPT3。前者因為在圍棋方面所展現的天賦盡人皆知,而后者則是在去年發(fā)布后就引發(fā)了AI科學領域的震蕩。
其實眾多AI模型的不斷出現,終極目標就是具備更高“等級”的智能。而每一次模型智能程度的提升,都使得模型也愈加復雜,模型尺寸也呈現爆發(fā)式增長。這里打一個不是很恰當的比喻,如果我們將施瓦辛格主演的《終結者》里面的天網,視為AI所能達到的的最高境界,那么2012開始出現的AlexNet網絡模型,以及此后幾年的ResNet、Transformer、BERT直至GPT-3等優(yōu)秀AI模型,就是在向天網這樣的終極目標邁進。
尤其是OpenAI實驗室推出的自然語言模型GPT-3,擁有1750億語言模型參數量,通過訓練已經可以寫詩、寫樂譜,回答歷史、天文問題,甚至涉足醫(yī)療領域,被一些科學家稱為“幼年期的天網”。與此同時,它也是名副其實的“算力吞噬者”。
顯然,越先進的大規(guī)模AI模型越需要耗費大量的計算資源,如果沒有強勁的算力支撐,訓練一個先進的模型所耗費的時間和金錢成本——絕對是很多人無法想象的。
舉一個簡單的例子:媒體機構量子位做了估算,訓練一個GPT-3模型需要一塊GPU運行355年;其訓練成本約在600-1200 萬美元。反觀2016年出現的Resnet-152模型,各方面成本不足GPT-3的萬分之三。
你覺得這已經很恐怖了?實際上就在2021年1月,谷歌大腦的科學家剛宣布他們設計的簡化稀疏架構(Switch Transformer)能將語言模型的參數量擴展到1.6 萬億,這已經近十倍于GPT-3了。
無需咂舌,這就是AI進化過程中不可逆的質變。
中國工程院院士鄭緯民鄭緯民曾經指出,下一代AI的發(fā)展亟需建設大規(guī)模的AI算力基礎設施。GPT-3取得了很好的進步,但是離人類智能還有差距,下一代人工智能模型可能超過萬億參數。如今,這個萬億參數的AI“巨獸”已經到來。
而在懂懂看來,承載AI的新型算力基礎設施的供給水平,將成為直接影響AI創(chuàng)新迭代及產業(yè)AI應用落地的關鍵因素。對算力的渴求,對AI模型的智能化追求,已經愈發(fā)迫切地將AI算力基礎設施建設話題提到了重要環(huán)節(jié)。
AI算力的“地基”建設迫在眉睫
可以看到,隨著模型尺寸的不斷膨脹,如何做到高效的AI訓練和計算,關乎到AI生產研發(fā)效率,實現高效的AI模型訓練的一個重要的支撐是更快更強的算力,即可以在更短時間內完成大規(guī)模AI計算,這對于AI產品的迭代效率和成功至關重要。
那么,如何打造一個強勁的算力支撐能力,如何有效降低訓練先進AI模型所需要時間和金錢?
首先強調一點,算力并不完全取決于芯片的能力。隨著越來越多的高級AI模型訓練開始“索求”巨量的算力支撐,計算力受芯片工藝的物理限制也愈發(fā)明顯,芯片制造工藝技術層面的提升速度已經落后于算法模型,某些模型已經逼近AI算力的極限。算力如果受限,算法模型的不斷創(chuàng)新也會出現制約。因此,算力已經成為未來人工智能應用取得突破的決定性因素。
在此前IDC聯合浪潮集團發(fā)布的《2020-2021 中國人工智能計算力發(fā)展評估報告》中也指出,2020年,中國的GPU服務器依然占據95%左右的市場份額,是數據中心人工智能加速方案的首選。未來幾年,隨著推理工作負載在各個行業(yè)應用中不斷增加,FPGA和ASIC等其他類型的加速芯片將在各個領域采用。
IDC預計到2024年,其他類型加速芯片的市場份額將快速發(fā)展,人工智能芯片市場呈現多元化發(fā)展趨勢。報告強調——服務器是人工智能基礎設施的核心,到2020年,中國人工智能基礎設施市場規(guī)模將達到39.3億美元,其中服務器支出占比高達87%。
可以看到,人工智能服務器技術的不斷創(chuàng)新,包含了多種互聯方式和拓撲架構,以滿足不同的應用場景需求,與此同時,人工智能基礎設施正在向開放架構發(fā)展,以滿足高效、靈活、可擴展的下一代人工智能數據中心的需求。
這里要強調一個關鍵詞:智算中心。實際上,在去年4月浪潮提出“智算中心”理念時,就指出要讓智慧計算可以像水電一樣,成為社會基本公共服務。
智算中心的意義,就是通過算力的生產、聚合、調度和釋放,高效支撐數據開放共享、智能生態(tài)建設、產業(yè)創(chuàng)新聚集,同時有力促進AI產業(yè)化、產業(yè)AI化及政府治理智能化。智算中心的內涵有著四個要點:一是算力公共基礎設施;二是計算架構技術領先、生態(tài)成熟;三是算力、數據和算法的融合平臺;四是以產業(yè)創(chuàng)新升級為目標。
這四點,正是對前面提及的行業(yè)應用需求爆發(fā)、算力匱乏及成本高企,以及AI技術發(fā)展對算力支撐等痛點的最佳解決路徑。結合國家層面對人工智能為主的戰(zhàn)略性新興產業(yè)的發(fā)展規(guī)劃,AI算力在基礎設施層面的意義就更為突出和緊迫。
一方面,從去年兩會政府工作報告中提出“新基建”,就明確了以人工智能、特高壓等新技術發(fā)力技術端的基礎設施建設。而在新近發(fā)布的十四五規(guī)劃建議中,提及重點關注的幾大前沿科技,人工智能與量子信息、集成電路位列前三位。因此,人工智能作為新一輪產業(yè)智能化變革的核心驅動力量,將會推動數萬億美元的數字經濟產業(yè)升級轉型。另一方面,作為AI算力的重要載體,實現算力、算法和數據全面融合的智能計算中心,將會為新基建發(fā)展所需的未來算力基礎設施提供重要參考定義。
也許有人會問,政府部門、不同行業(yè)、大型中小型企業(yè)能夠從智算中心這樣的基礎設施上獲得什么?
首先,是推動國內AI產業(yè)化浪潮的創(chuàng)新發(fā)展進程。智算中心作為人工智能軟硬件技術的一體化融合載體,為人工智能產業(yè)的發(fā)展提供了大規(guī)模數據處理和高性能智能計算支撐,可以讓人工智能技術更加高效地實現訓練、推理等學習過程。一方面,智能計算中心的構建將推動“平臺+應用+人才”三位一體的新型AI產業(yè)發(fā)展模式,另一方面,將會完善“算力+生態(tài)”體系,加速推進從基礎層到應用層的人工智能產業(yè)鏈的形成。
其次,是驅動產業(yè)AI化轉型升級。如同公有云對于企業(yè)信息化轉型所帶來的的裨益,智算中心作為新型基礎設施可以幫助企業(yè)低成本、高效率地進行數字化轉型。不同類型的企業(yè),可以根據業(yè)務需要依托智算中心提供的AI模型庫、AI算力調度平臺等自動生成適用于實際需要的業(yè)務系統模型。同時,智算中心通過提供算力基礎設施及通用軟件服務,聯動產業(yè)鏈上下游,可以為企業(yè)提供完整的AI服務鏈,幫助實現AI供給和需求的高效對接。
最后,是助力政府治理能力現代化。在當下智慧城市建設的進程中,智算中心能夠融合人工智能、互聯網、大數據、云計算等信息技術,迅速將線上線下各類型治理主體聚合在一起,提供數據分析、云計算平臺、算法和計算能力等工具和資源,大大提升社會治理過程中的數據計算、分析、挖掘能力,從積極推動政府治理能力的現代化。
當然,這其中最關鍵的是要算經濟賬,提升效率、降低成本才是基礎設施對于所有行業(yè)最大的助力??梢钥吹剑撬阒行淖鳛樗懔ιa供應平臺,在構建過程中以融合開放的架構計算系統為平臺,以數據為資源,免費或低成本提供很多開源的人工智能算法及其代碼,以強大算力驅動AI模型來對數據進行深度加工,源源不斷產生各種智慧計算服務,通過服務形式向組織及個人進行供應。
同時,智算中心可以通過平臺開放接口的方式,將行業(yè)領軍企業(yè)的算法能力、數據資源及運營服務等輸出給IT基礎薄弱的企業(yè),使全社會AI應用成本得到大幅降低。
從這幾方面來看,智算中心作為新時代基礎設施建設的必要性毋庸贅言,而迫切性也不言而喻。
產業(yè)AI化——獨樂樂不如眾樂樂
從這幾方面來看,AI算力作為基礎設施建設的價值和意義已經非常明晰,那么,在打造這一“地基”的產業(yè)變革中,浪潮又希望扮演一個什么樣的角色?
在IDC發(fā)布的2020HI《全球人工智能市場半年度追蹤報告》中可以看到,目前全球半年度人工智能服務器市場規(guī)模達55.9億美元,浪潮以16.4%的市場占有率,位居全球人工智能服務器市場第一。從這一點來看,浪潮在AI產業(yè)化浪潮中可以繼續(xù)一路領先。
但是去年底在一些公開場合聽到浪潮AI&HPC總經理劉軍分享自己的觀點時,有一句話引人關注?!皬氖袌龅牧考墎砜矗珹I產業(yè)化是千億級別的市場,產業(yè)AI化是萬億級別的市場。我們在AI產業(yè)化可能走的更快一點,在產業(yè)AI化上可能需要抓緊趕上去?!?/p>
AI產業(yè)化與產業(yè)AI化在文字上的細微差別,背后卻是科技行業(yè)與所有行業(yè)在AI應用場景上的巨大差異。幫助所有行業(yè)落地和應用人工智能,才是一個無限寬闊的市場,和一個長久可持續(xù)的未來。
這其中,浪潮要做的不是自己一家獨大,而且協同更多的伙伴,把這個萬億市場共同做大、實現共贏。這,也是浪潮智算中心在新基建打造過程中所扮演的角色。
一方面,智算中心的建設要滿足三個基本條件:開放標準、集約高效和普適普惠;另一方面,這一體系將持續(xù)投入面向AI時代的三個要素——計算力輸出、服務能力優(yōu)化及人才培養(yǎng)。在懂懂看來,只有在打造以AI算力為核心的基礎設施過程中,幫助和促進生態(tài)伙伴的優(yōu)勢互補、強強聯合,共同成就行業(yè)最終用戶,才是智算中心的商業(yè)化核心價值。而這種AI時代的“多贏”理念,確實遠遠超出了傳統意義上的“AI產業(yè)化”范疇。
從浪潮過去一段時間以來的各種舉措已經可以看到,其一直在不斷推動智算中心IT基礎設施建設朝著更深、更寬范疇發(fā)展。自1993年浪潮成功研制出中國首臺小型機服務器以來,經過近30年的積累,浪潮已經攻克了高速互聯芯片、關鍵應用主機、核心數據庫、云數據中心操作系統等一系列核心技術?,F在,圍繞智算中心,浪潮持續(xù)深耕,開發(fā)出硬件重構的智算中心算力系統,以及軟件定義的智算中心操作系統等等。與此同時,在很多業(yè)務面浪潮與合作伙伴也在共同嘗試打造智算中心的底層,向政府和行業(yè)用戶提供端到端的智慧服務,輸送源源不斷的計算力。
可以確定一點,產業(yè)AI化是要深入到每一個行業(yè)應用實踐中,具體的產品、具體的挑戰(zhàn)都要選擇適合的算法、模型和處理方式,浪潮攜手眾多理解行業(yè)應用場景的開發(fā)商、軟件商、集成商,與這些合作伙伴共同完成行業(yè)應用的落地,目標不僅是利己利他,而是對人工智能與綜合國力發(fā)展之間邏輯關系的透徹理解。
【結束語】
正如埃森哲研究所發(fā)現的,通過有效應用智能計算,中國經濟增長率有望上升至7.9%,增長額高達7.1萬億美元。未來,人工智能將每年為中國經濟增長貢獻0.8至1.4個百分點。
從這一點來看,智能計算產業(yè)作為數字經濟的重要載體,將作為一支新興力量,帶動全球數字經濟走向繁榮。人工智能計算需求未來將占據80%以上的計算需求,智能計算正成為未來經濟的主要增長點之一。那么,順勢而為的浪潮,也將在這一增長勢頭中起到令人矚目的推動作用。