大模型賽道上,上海如何跑在前面?
走出龍耀路地鐵站,現代、繁忙、藝術的上海西岸藏著答案。這里距離黃浦江濱江岸線幾百米,沿路能看見休閑的行人,更多是腳步匆忙的白領。方圓一公里內,坐落著騰訊、阿里、微軟、上海人工智能實驗室、商湯、無問芯穹、蜜度蜜巢等科技巨頭和AI大模型初創公司。
就在這個地鐵站旁邊,是全國首個、上海唯一的大模型創新生態社區“模速空間”。2023年9月28日,經歷38天快速籌建,模速空間正式揭牌。不到半年時間,這里吸引了60多家大模型企業入駐,其所在的徐匯區已聚集近300家產業鏈上下游企業,規模仍在擴大。
人工智能(AI)是上海重點發展的先導產業,產業規模從2018年1340億元到2022年突破3800億元,年均增長超29%;規模以上企業數,也從2018年的183家增至2022年的348家。
大模型正引領新一輪人工智能變革,業界普遍認為,大模型是邁向通用人工智能的核心引擎,將帶來人工智能的再次躍升,已經成為全球科技競爭焦點。
2024年,全國前4批次通過上線備案的大模型中,上海占據24個。其中,徐匯區獨占15個,集中在模速空間。
可以說,模速空間是觀察上海AI大模型產業發展的最佳窗口。這片區域,正在產生越來越大的集聚度、顯示度、影響力。
3月下旬,2024全球開發者先鋒大會(GDC)開幕,地點設在上海西岸,以“模速空間——開發者的模力之源”為主題,許多人冒雨前來參加。2月份,上海市委書記陳吉寧調研上海模速空間創新生態社區,主持召開人工智能科創機構和企業座談會,聽取意見建議、進行現場辦公。
如果說現在正值大模型的“風口”——固然未來有很長的征途,在這個時間節點,上海已搶占先機,跑在前列。模速空間,正力爭成為代表上海乃至國家贏取全球科技戰略競爭主動權的“主力因子”。
近日,澎湃新聞記者以模速空間為切入點,實地探訪并訪談多個大模型企業、政府相關負責人,探尋上海布局AI大模型賽道的前后過程和基礎邏輯。
“上下樓就是上下游”
從地圖上看,模速空間所在的上海西岸,分布著上海人工智能實驗室、期智研究院、商湯科技、阿里巴巴、騰訊等知名科研機構和科技企業,形成一個人工智能產研生態圈。模速空間,在其中扮演專業孵化和加速載體的角色。
模速空間寬敞的公共區域,許多人辦公、交流、開會。
3月下旬,澎湃新聞記者走進模速空間,這里和許多創業園區相似,設施簡潔、舒適,環境明亮,除了一個個獨立辦公空間,寬敞的公共區域經常有人圍在一起交流,氣氛輕松。目前模速空間一期、二期共2萬平方米已投入運營,三期已在規劃建設中。
與其他創業園區不同的是,模速空間聚焦AI大模型領域。許多企業在門口設有公司簡介,有的專注金融、商業垂類大模型,有的致力于通過大模型改善購物體驗,一些企業面向政企服務(ToB/ToG),一些則直接服務個體用戶(ToC)。
在模速空間5樓,“金聲玉亮”合伙人查小薈剛結束上一場會議,在公共區域快速騰出一處角落與記者交流。她說金聲玉亮屬于金融垂類大模型,可以視作投資顧問的助手,幫助解答客戶有關個股、行業、大盤的相關問題。
“我們的客戶有不少金融大V,以前他們需要每天或定期錄制短視頻投放,停更時間長了就會掉粉。現在用數字分身,可以解決大V分身乏術的困擾。熱點、內容、文本、肖像動作,一鍵就可以生成出來?!辈樾∷C說,金聲玉亮的語料庫24小時不間斷更新,很多金融投資熱點,大模型能實時作答。
模速空間的很多創業者和查小薈一樣忙碌、干練,幾乎隨時都有研發人員用中英文召開線下或線上會議。許多中國AI技術人員每天加班加點,鉚足了勁頭希望超越OpenAI。
徐匯區科委主任張寧在接受澎湃新聞記者采訪時表示,這一輪人工智能企業創業,創始團隊都有很強的產業背景:模速空間90%的創始團隊有連續創業或大廠背景,80%的創始人來自頭部名校,50%的團隊有海外經歷。
這里流傳一句話:“上下樓就是上下游。”張寧解釋,“在一棟樓里,聚集著大模型底層技術、應用研發、場景設計、算力支持、產品營銷等一條產業鏈上不同的企業。”
政府作為“店小二”,希望在很近的物理空間范圍內,讓科研人員能找到任何想見的人、對接任何想接觸的資源、獲取任何想得到的生活服務,這是模速空間要做到的“集聚”。
這種集群效應,讓入駐其中的企業深有感受。“我們的很多服務對象就在這棟樓里,走到隔壁辦公室問一問,或者在孵化器組織的活動中就能了解行業的最新動態。”“開放傳神”創始人張家慶把公司的加速發展,歸功于一棟樓匯聚整條產業鏈的空間格局。
3月29日下午,在模速空間,蜜度蜜巢負責人劉益東在為央企高管介紹企業情況。
模速空間運營方、上海大模型生態發展有限公司總裁陳海慈告訴澎湃新聞記者,模速空間希望能形成一個產業鏈的閉環和生態,產生上中下游的和諧共鳴?!皞鹘y來說,其實就是提供一個空間的服務,類似于大家今天講的孵化器或是眾創空間,該有的我都有,物業、法律、投融資等等都會覆蓋到。但是,更重要的是結合產業自身的特點,能為大家提供差異化的內容。除了那些傳統的東西,我們會差異化地跟各類企業發展相關的核心內容,有針對性地解決問題?!?/p>
蜜度蜜巢總裁、蜜度CTO劉益東告訴澎湃新聞,其公司以上海人工智能實驗室開發的書生通用大模型為基座,在政務垂類應用上發力,自主研發的蜜巢政務大模型能為企業和政府提供知識管理、數據挖掘等服務,已發布2.0版。
“‘書生’作為一個基座大模型,它也需要垂類應用參與,我們希望能夠在這個里面成為強有力的生態建設者?!眲⒁鏂|說。輔助是相互的,此前蜜度蜜巢向書生·浦語供給了語料,加入由上海人工智能實驗室牽頭的“語料數據聯盟”。高質量、大規模、安全可信的語料數據,對于大語言模型的訓練和性能提升至關重要。
張寧表示,匯集60多家大模型企業的同時,模速空間形成了算力調度、開放數據、評測服務、金融服務、綜合服務等全方位的創新創業保障。
舉例來說,算力是大模型公司最大的瓶頸,如果沒有以算力為核心的基礎設施作為支撐,大模型根本就跑不起來。模速空間的算力調度平臺,對接了商湯、華為、騰訊、阿里和三大電信運營商等9家供應商,超過50000張GPU卡,全力保障大模型企業算力可用、夠用、好用。
“半步優勢”
人工智能并不是新興事物,如果從1950年代圖靈問出“機器能否有人類智能”算起,人工智能已經歷半個多世紀的發展。只不過直到這一兩年,隨著ChatGPT和Sora的出現,AI大模型才終于引爆整個行業,讓很多人看到“商業價值”。
2023年被稱為大模型元年,國內外科技、AI企業紛紛下場試水,中國涌現出200多個大模型,一時間掀起“百模大戰”。通用大模型、行業大模型、垂類大模型……各式大模型出現,各行各業都想從中分一杯羹。
雖然行業很熱鬧,創業者很興奮,但大模型具體怎么落地商用,很多人似乎摸不著頭腦。一些業內人士發現,與2023年ChatGPT帶來的投資熱潮不同,2024年Sora出現后,“大廠”顯得“冷靜”很多。
也在2023年,當很多大廠、企業看待AI的眼光終于從“技術”轉換為“產業”時,上海徐匯悄然打造了一個“AI生態社區”,把產業鏈上、中、下游聚集在一起,全方位賦能應用。
換句話說,當大家都在卷模型的時候,上海創造了一種新“玩法”。
經過2023年的一輪“燒錢”,很多企業達成了一個新的共識:通用大模型,只是少數人的游戲;下一階段,機會在行業大模型、垂類大模型。不久前百度創始人李彥宏也說:“大家不要去卷模型了,卷應用吧,只有應用直接創造價值”。
模速空間入駐的60多家大模型企業,超過80%是來自垂類領域的應用企業?!按诡惪赡苁巧虡I落地過程中多數企業唯一的選擇?!辈樾∷C從行業角度分析,通用大模型成本太高,產品很容易“中庸”,“好像什么都能做,又好像什么都做不好”,中小企業玩不起。
在產業風口,模速空間能夠快速集結一批高水平的大模型企業,實屬難能可貴。在張寧看來,一方面,這基于上海市和徐匯區的人工智能產業積淀,“我們很早就抓住了人工智能的變革趨勢和產業風口”。
自2017年起,上海在全國率先布局發展人工智能產業,2018年舉辦首屆世界人工智能大會,至今連續舉辦6年,徐匯一直是核心承載地。這幾年,上海AI產業規模從2018年1340億元躍向了2022年3821億元。
很多人以為模速空間“橫空出世”,張寧清楚背后的積累和布局。幾年前,當人們把AI視為不賺錢的“技術”時,上海已開始把它當作產業賽道。一個典型的例子,就是培養和發展人工智能獨角獸企業商湯科技。
另一方面,張寧說,模速空間的快速誕生和壯大,相關部門作了大量調研分析、抽絲剝繭,“我們是把大模型產業看明白了再招商的。”張寧說,和AI科學家、企業家打交道多年,他發現對大模型創業者來說,好政策固然重要,但企業往往更喜歡也更需要一個能夠理解大模型產業,也懂得如何幫助大模型企業的政府。
基于此,模速空間作為全國首個、上海唯一的大模型創新生態社區,誕生在徐匯。張寧把這個過程謙遜地形容為“半步優勢”。
不過,即使有“半步優勢”,在大模型日趨白熱化的競爭當中,任何城市都無法松懈。
2023年11月,上海印發《上海市推動人工智能大模型創新發展若干措施(2023-2025年)》,推出一系列支持大模型創新發展的政策措施,推動大模型語料聯盟的實體化運作,開源一系列高質量的語料數據,為全球人工智能開發者創新創造構建更良好的生態環境。
徐匯區更進一步,推出許多增量舉措。模速空間不僅有基金投資、產業鏈合作、房屋租金等優惠,初創企業還有“算力券”支持,這一平臺降低企業大模型訓練門檻,牽引大模型在金融、教育、醫療、制造等典型領域的垂直應用。
招商優質企業的同時,上海積極吸引青年人才。2024年3月初,徐匯區委書記曹立強親自帶隊,組織30余家高科技領域的企事業單位赴清華北大招聘,參與招聘企業超過1/3屬于人工智能領域。
創新成果涌現
圍繞模速空間,目前上海西岸已誕生4個底座基礎大模型,即上海人工智能實驗室的書生通用大模型、商湯的“日日新”senseNova大模型體系、MINIMAX-ABAB大模型、界躍星辰大模型。垂類應用更多,相關產品已達百余個。
3月23日,2024全球開發者先鋒大會上,上海市副市長陳杰談道,上海大模型創新成果不斷涌現,上海人工智能實驗室開發的“書生浦語”大模型開源發布,多款人形機器人也即將發布。他還提到,大模型產業載體持續拓展,模速空間已吸引60多家大模型企業入駐。
作為科研一線代表,上海人工智能實驗室主任助理、領軍科學家喬宇表示:“大模型目前正在朝多模態方向演進,我們建立了一個具備知識、對齊、價值3個層面的新的多模態大模型評測體系,這將為未來大模型的發展以及評測提供新的參考和引領?!?/p>
在這次大會上,階躍星辰發布了該公司Step系列通用大模型,包括Step-1千億參數語言大模型,Step-1V千億參數多模態大模型,以及Step-2萬億參數MoE語言大模型預覽版——這也是國內初創公司里首個萬億參數大模型。
上海階躍星辰智能科技有限公司CEO姜大昕是微軟前全球副總裁,他說,模型的參數從千億到萬億,數量上提升了一個量級,在難度上也對算力、系統、數據、算法各方面提出了挑戰。
澎湃新聞注意到,無論上海人工智能實驗室、商湯、界躍星辰等基礎大模型企業,還是蜜度蜜巢、金聲玉亮等垂類模型初創企業,目前發展速度和更新迭代都非???,并且開始收獲商業上的成功。
商湯科技,基于SenseCore商湯大裝置提供的算力,在四方體的不同立面上呈現出與平面圖像一樣的畫面。
在接受澎湃新聞采訪時,商湯科技董秘辦董事總經理盛世偉透露,生成式AI業務已成為商湯從無到有并超過10億元收入體量的核心業務。財報顯示,2023年商湯實現總收入34億元,其生成式AI業務創造了11.8億元的收入,收入增長率達200%,占該集團總收入的35%。
2024年2月,商湯推出了“日日新”大模型4.0版,在代碼編寫、數據分析和醫療問答等多場景中達到了與GPT-4相匹配的能力。而僅僅2個月后,新版馬上就要迭代更新了。
“在即將到來的4月下旬,我們會有一個技術交流日,屆時將展示我們更新的‘日日新’5.0大模型的能力?!笔⑹纻ネ嘎?,“日日新5.0”版本的性能全面對標GPT4-Turbo。
對初創大模型企業而言,吸引大公司投資、合作是發展壯大的重要機遇。而對很多大企業而言,“AI+”更是這一輪大模型浪潮的核心,大模型有望賦能千行百業,成為實體經濟發展的新引擎。
3月29日下午,許多央企高管參觀模速空間。
“(蜜度)蜜巢剛剛介紹的AI知識管理,對我們來說會有比較大的助力?!?月29日下午,央企航空工業機載總經理雷宏杰在參觀模速空間時說。
“會考慮和上海大模型企業合作,把這樣的新技術應用到企業管理中嗎?”澎湃新聞記者問。
“我覺得這個是必需的,要提高企業的效率,像剛才講的知識管理、數據挖掘等模式,現在大模型可能是最好的解決方案?!崩缀杲軓娬{,“但首先得保證安全性,這對企業非常重要?!?/p>
“這次來上??矗ù竽P彤a業),對我們有很大收獲。”雷宏杰補充道。
借助產業風口,垂類大模型企業迎來了前所未有的機會。查小薈也深刻體會到了這種變化。公司在談第一家券商客戶時,整整用了一年。但最近幾個月,不斷有新客戶自己找上門來?!敖鹑谛袠I越來越感知到對人工智能的需求?!彼f。
在模速空間5樓,百思瑪特是一家專注于商品精準營銷的大模型企業,類似電商導購,其聯合創始人邱運偉是一名90后,此前在美國硅谷工作,2023年11月開始扎根上海模速空間。
這個創業團隊目前只有十余人,主要成員此前均供職于IBM、Facebook等科技公司,他們是模速空間典型的一類創業者。邱運偉打開電腦,展示公司2024年1月在國內推出的首款產品“芝麻AI”,上線首日就登上微博熱搜,有超過10萬用戶。
“未來可能充滿了很多不確定性,公司目前聚焦在半年之內,3到6個月驗證我們產品在相關垂類市場的情況,收集更多數據,提升產品性能。”這個青年創業者說話時朝氣蓬勃。
雖然是規模不大的初創企業,像百思瑪特這樣的電商垂類大模型,如果發展得好,未來很可能徹底顛覆現有的電商模式。
實現這一切愿景還需要時間。在陳海慈看來,大模型產業的“打法”和之前的其他產業相比存在巨大的差別,重點在于創新生態,“在之前的競爭中,就看誰出的人多、誰付的錢多、誰給的政策好。毫無疑問,上海在這些方面是有優勢的,但我認為,最后決定性要素是創新策源的鏈接。所以我們更關注的,是怎么提高創新生態的濃度,讓大家做大模型的產業時,他就會想到模速空間。”