“算力風暴”是橫亙于國內大模型發展路上的第一道坎,數據顯示,過去四年,大模型參數量以年均400%復合增長,AI算力需求增長超過15萬倍,遠超摩爾定律。
“商湯人工智能計算中心幾乎已經滿負荷,正在擴建,上海電信等算力提供方也在建設國產算力集群,即將對外開放。”業內人士向《IT時報》記者表示。
繼打造人工智能產業高地后,上海提出要建設具有國際影響力的大模型生態高地,從魔都到“?!倍迹邕^算力坎。上海正在以全市之力解決算力短缺問題,政府牽頭統籌、調度、共享算力資源,還對使用算力的大模型企業大規模發送“算力券”。
更多中小企業表示,數據和人才是大模型之爭的核心資源,也是燃眉之急。經過近十年科創中心建設、五年人工智能高地建設,上海已經深諳創新之路。不久前發布的《上海市推動人工智能大模型創新發展若干措施(2023~2025年)》中提出十一條措施,不僅要共建共享語料數據資源,還要支持大模型人才落戶。
“算力風暴”倒逼芯片國產化
上海建設自主可控算力網絡
“算力很缺,畢竟做大模型預訓練急需好用的大集群。”達觀數據CEO陳運文向《IT時報》記者提到,為了訓練曹植大模型,達觀數據斥巨資自建中等規模的算力集群,但對小企業來說,如果無法承擔高額算力成本,只能用別人開發好的大模型。
在上海,目前規模最大的算力中心應數商湯人工智能計算中心(AIDC),已經上架3萬多塊GPU,產生超過6000 PetaFLOPS算力,可支持20多個千億參數規模的大模型同時訓練。
然而,即使商湯早在2022年便已建成這座占地87畝的人工智能計算中心,但AIGC帶來的大模型算力風暴席卷速度遠超預期。如今,這一亞洲最大的智能計算中心正在擴建中。
但,選誰的芯片?
隨著美國針對英偉達高端GPU先后發布兩次禁令,中國企業已經意識到,只有支持國產GPU,走自主可控之路,才能在大模型之路上走得長遠。
上海市經信委基礎設施處處長潘焱在2023年11月舉行的“算力網絡與大模型”產業生態論壇上表示,除了保障算力供給與調度外,上海也在構建自主可控的算力網絡建設。同一論壇上,上海電信副總工程師肖晴提到,上海電信已經在臨港建設了數千卡國產算力集群,2024年爭取推出萬卡集群。
2023年4月,《IT時報》記者在參觀商湯AIDC時發現,其芯片國產化已在進程中。
同樣作為算力提供方,優刻得在內蒙古烏蘭察布和上海青浦兩大數據中心可提供超3000 PetaFLOPS的AI算力,也在布局國產算力,與沐曦、壁仞等國產芯片廠商聯合測試。
優刻得副總裁劉杰曾在接受《IT時報》記者采訪時表示,雖然在支持大模型訓練上,國產芯片尚有一段距離需追趕,但在大模型推理上,國產芯片較有前景,未來預估大模型訓練和推理的算力芯片需求是1:3至1:5,甚至更高。
最高補貼10%
上海大規模發放“算力券”
上海市區兩級正在密集出臺算力相關政策。據《IT時報》記者了解,上海政府對算力補貼的政策分為兩大類,一是針對算力提供方,對納入統籌管理的算力平臺進行建設補貼;二是針對算力使用方,對使用算力的單位給予最高10%算力補貼,類似于“算力補貼券”。
2023年11月,上海制定了《上海市推動人工智能大模型創新發展若干措施(2023~2025年)》,被稱為人工智能大模型發展十一條措施。其中,第三條提到的大模型智能算力加速計劃,將對2024年底前在滬完成智能算力部署并納入統籌、接受調度的算力建設主體,經評估給予適當額度的部署獎勵;對租用納入本市統籌調度的算力進行大模型研發的本市主體,經評估按算力集群規模和成果水平給予最高10%的租用補貼。建設市域極速智能算力承載網,實現市域智能算力中心間100Gb/S以上高速直連和毫秒級時延。
2023年12月,徐匯區開展人工智能大模型算力補貼項目,申報條件主要是設立在徐匯區的算力需求主體,上年度研發投入占主營業務收入5%以上,研發人員占項目研發團隊總人數50%以上等等。
徐匯區科委主任張寧在“算力網絡與大模型”生態產業論壇上重點提到幾點,一是在徐匯西岸創建“模速空間”大模型生態社區;二是與算力供應商開展區域“智能算力加速計劃”,加強市區算力統籌、探索自建算力服務;三是大模型算力補貼項目,確保大模型企業算力“夠用、好用”。
上海市經信委也在落實“模速空間”的專項政策,協調上海電信等算力供應方,加速對“模速空間”的算力供給,對接入駐企業的算力需求,支持企業的模型開發與應用。
根據規劃,到2025年,上海市數據中心算力將超過18000 PFLOPS,人工智能公共算力服務平臺能級躍升,完善算力交易機制,實現跨地域算力智能調度,通過高效算力調度,推動算力供需均衡,帶動產業發展作用顯著增強。這是《上海市推進算力資源統一調度指導意見》提出的2025年計劃,可見上海對解決算力困局的清晰目標。
誰掌握優質數據誰突圍
上海共建共享數據資源
算力、算法、數據,被認為是大模型的競爭三要素。近期,研究機構Epoch AI指出,對數據需求急劇增加,以致可用于訓練的高質量文本可能會在2026年耗盡。
“優質數據才是未來大模型的核心競爭力,誰掌握的優質數據多,誰能用得更好,誰就能突圍,但中文教科書只有英文的十分之一。”達觀數據CEO陳運文認為,知識密度高的文檔資料才是大模型訓練的優質數據,包括教科書、論文、報告等,而微信聊天記錄、淘寶聊天記錄等數據的有效性弱。目前,散落在出版社、圖書館等機構的優質數據,難以界定版權歸屬于作者、出版社還是其他機構,這將成為大模型發展的一大難點。
優刻得計算產品線總經理鐘春山也認為,中文數據的短缺將阻礙大模型的發展,應加大數據共享。另外,政府可以多開放應用場景給大模型公司,場景用起來有三個好處:首先能形成反饋,對模型進行調整優化;其次能產生更多經濟價值,讓大模型真正深入產業;最后能幫助各行各業提高效率,解決信息不對稱的問題等。
目前,全球70%的數據源僅停留在免費公開數據集的層面,上海數交所總經理湯奇峰也曾表示,大模型成長所需的高質量數據庫仍存在供給不足、質量不高、多樣性匱乏、標準欠缺等問題。
2023年7月6日世界人工智能大會開幕式上,上海宣布成立大模型語料數據聯盟,由上海人工智能實驗室聯合中央廣播電視總臺、人民網、國家氣象中心、中國科學技術信息研究所、上海報業集團、上海文廣集團等10家單位聯合發起。
2023年11月,聯盟“朋友圈”擴容,12家新成員加入,同時,上海人工智能實驗室聯合人民網發起成立中國大模型語料數據聯盟安全治理專委會,為的是推動大模型數據安全治理與隱私保護。
早在人工智能發展初期,上海已經在數據共享上開了許多先河。此次,上海市人工智能大模型發展十一條措施也提到,共建共享語料數據資源,包括組建大模型語料數據聯盟、建立語料數據知識產權保護框架、依托上海數據交易所建立語料數據交易板塊等。
AI工程師薪酬躍居首位
上海吸引大模型人才落戶
AI Agent是大語言模型落地的最熱應用場景之一,瀾碼科技是研發AI Agent等大模型應用的公司?!拔覀冎苯诱{用大模型,算力成本由大模型公司承擔,類比云計算公司,我們調用云服務,按需付費,所以難點是如何挑選不同能力、不同價格的大模型。”瀾碼科技CEO周健解釋道,算力對大模型下游企業來說,還不是最難的挑戰。
對周健來說,最大的挑戰是人,AI產品經理、AI需求分析師都十分稀缺。
咨詢公司麥肯錫一份關于人工智能的報告顯示,預計2030年中國對AI專業人員的需求將增至2022年的6倍,人才缺口將達到400萬人。搶人大戰讓人工智能工程師的薪酬水漲船高,智聯招聘2023年第四季度《中國企業招聘薪酬報告》顯示,人工智能工程師的平均招聘月薪躍居職業榜首位,高達22788元。
早在2018年,上海就已開始筑巢引鳳,上海市經信委主任張英曾介紹,從2018年至2022年,五年間,上海人工智能產業規模從1340億元提升至3056億元,產業人才從10萬提升到23萬。
如今則進一步落實吸引大模型人才的政策。上海市人工智能大模型發展十一條措施也提到,優先推薦大模型創新重點人才納入國家和本市相關高層次人才計劃,重點支持大模型相關緊缺技能人才落戶等。
“上海的數字化建設水平、數字化人才儲備,都是上海發展生成式人工智能的先天優勢?!边@是吸引周健留在上海創業的重要原因。
人工智能走到2.0時代,這句話在上海AI圈,已然具體可感知。金山辦公WPS AI背后的大模型創業公司MiniMax,其聯合創始人是前商湯科技副總裁、通用智能技術負責人閆俊杰。主攻AI Agent的瀾碼科技,其創始人兼CEO周健是依圖10號員工。
在一波接一波的人工智能浪潮中,能留住人才,才是筑造高地的根本。
大模型企業到底最缺什么?多家上海大模型上下游企業告訴《IT時報》記者,當前最緊急的是缺算力,中期要解決的是缺人才,未來最重要的難題是缺數據。
上海,因為錯過了互聯網浪潮下誕生的BAT,多少年來被質疑不適合創業。但它用近10年的時間證明,上海適合創新。2015年,上海提出要建設具有全球影響力的科技創新中心,在創新上尋覓新疆域。
人工智能是上海走向科技創新中心的三駕馬車之一,2022年,上海出臺人工智能領域首部省級地方性法規《上海市促進人工智能產業發展條例》,正式提出把上海市建成具有國際影響力的人工智能高地。不僅為我國人工智能治理貢獻了“上海方案”,也為上海接住大模型浪潮鋪了路。
如今,上海市人工智能大模型發展十一條措施出臺,政府在算力、人才、數據等方面全維度著力,可見魔都上海向“?!倍嫉霓D型,是堅定而具體的。