上市一年有余,“AI第一股”商湯科技再次交出了一份穩健的業績答卷。數據顯示商湯科技2022年營收達38.09億元,毛利率為66.8%。
2021年12月30日,商湯科技成功登陸港股,造就了全球AI(人工智能)領域最大資金規模的IPO。
【資料圖】
彼時,產業已經渡過早期的喧囂,開始邁進發展的深水區,質疑伴隨著市場的理性情緒一起到來。這樣的背景中,堅持對AI基礎設施SenseCore進行研發投入的商湯科技走上了一條孤獨之路。
彼時沒人能想到,一年之后,NLP大模型ChatGPT在全球掀起熱潮,吸引無數企業和資本爭相涌入這一領域。
對于商湯科技而言,從2014年成立開始,對大模型及相關技術的積累就貫穿于企業的生命線之中。發展至今,公司已經摸索出屬于自己的獨特發展路徑。
作為長期深耕底層技術研發、不斷探索和更新商業化路徑的“領先選手”,一幅值得期待的藍圖正在商湯科技面前慢慢展開。
大模型熱潮中的穩健標的
早在1965年,人工智能先驅、圖靈的老師司馬賀曾樂觀預測道:“在20年之內,機器就能夠做到一個人能做到的任何事。”
遺憾的是,技術的發展與迭代難以預測。隨著產業發展,研究者們將這種理想的模型概念進一步擴充為“通用人工智能(Artificial General Intelligence,AGI)”——具有一般人類智慧,可以執行人類能夠執行的任何智力任務的機器智能。但盡管一代代研發者進行投入,通用人工智能的實現仍舊遙遠。
直到2022年末,NLP(自然語言處理)大模型ChatGPT橫空出世,這個上知天文、下知地理的生成式AI模型讓人們意識到,或許人類終于敲開了通用人工智能的大門。這也是比爾·蓋茨評價ChatGPT誕生“意義不亞于互聯網和個人電腦的誕生”的原因。
技術跨越式演進掀起的熱潮,終于讓資本意識到了超大模型的研發價值。
仿佛一夕之間,對人工智能的投資再次成為主流話題,不僅一級市場中“生成式AI項目”成為追逐熱點,國際科技大廠紛紛入局;二級市場中,相關概念股的股價隨之水漲船高。
然而,突擊式的投資、對熱點和市場情緒的追逐,從來都不是人工智能產業發展的“脈搏”所在。就像商湯科技董事長、首席執行官徐立在2022世界人工智能大會上曾說過的:“人工智能和天文都是寂寞的科學,需要大量且漫長的長期積累。”
隨著產業發展趨向于理性,狂熱的情緒終會消弭,企業實力才是玩家們最終能否趕上這一波大模型風口的關鍵點。
對AI企業而言,保持技術和產品的先進程度、積極探求商業化的可能性尤為重要。
從這兩個角度而言,商湯科技均已走在了行業的前頭。
基于此前積累的技術能力,2023年3月14日,商湯科技開源了多模態(指能夠處理文本、圖像、音視頻等多種數據類型)多任務通用大模型“書生(INTERN)2.5”。
書生2.5在多模態多任務處理能力方面實現多項全新突破,具備圖文跨模態開放任務處理能力,可為自動駕駛、機器人等通用場景任務提供高效精準的感知和理解能力支持。
這也是在ChatGPT掀起大模型熱潮之后,國內較早發布的自研大語言模型。從發布當日起,書生2.5就在通用視覺開源平臺OpenGVLab上開源。
▲(書生2.5,圖源/商湯科技)
在保持技術領先的同時,商湯科技還在持續優化自己的盈利能力。
根據最新發布的2022年業績報告,商湯科技業務結構實現轉型,智慧生活、智能汽車、智慧商業、智慧城市四大業務線矩陣全面升級,其中智慧生活、智能汽車整體收入均大幅上漲。
“大模型+大裝置”長期戰略彰顯前瞻性
早在2015年,商湯科技就開始研發深度學習訓練框架SenseParrots,并逐漸以此為核心、持續研發攻堅,搭建起AI基礎設施SenseCore,賦能千行百業。
至今,商湯科技仍保持著穩定、高水平的研發投入。以2022年為例,商湯科技研發投入達到40.14億元。同時在2022年,商湯科技的人均研發效率持續提升,人均每年研發模型數相較于2021年進一步提高了90%,達到9.35個。
這種對SenseCore AI大裝置的長期投入,成為了商湯科技能夠在大模型潮流中保持領先的“底氣”。
SenseCore建立在AI原生基礎設施層、深度學習平臺層、算法模型層之上,打通了算力、平臺、算法。基于此,商湯科技能夠將不同層次的能力按需調配,進行流暢、標準化、端到端的AI模型自動生產過程,也就是提供AIaaS(人工智能即服務)。
▲(商湯科技SenseCore AI大裝置,圖源/商湯科技)
SenseCore AI大裝置的特點,可以被歸結為普惠、彈性、開放這三個詞語。其所提供的AIaaS具體包括IaaS(計算基礎設施服務)、PaaS(深度學習平臺服務)、MaaS(模型部署及推理服務)三大部分的能力。
不論是大模型客戶,還是垂直領域內的中小模型客戶,不論是需要成熟模型遷移的用戶,還是AI模型研發者,都可以借助SenseCore“搭配”出適合自己的解決方案。
在此前的實踐中,商湯科技已經賦能了許多行業的2B客戶,截至2022年末,商湯科技累計生產的商用AI模型達到了6.7萬個。
在大模型領域,SenseCore AI大裝置同樣經受得起考驗。2022年,商湯科技全面布局生成類預訓練大模型,實現并完善了文本、語音、圖像、視頻、3D場景的多模態生成能力。
年內,商湯科技SenseCore AI大裝置持續擴建,完成了2.7萬塊GPU的部署并實現了5.0 exaFLOPS(每秒浮點運算次數,一種計算速度單位)的算力輸出能力。在這一基礎上,SenseCore AI大裝置最多可以支持20個千億參數量大模型(以千卡并行)同時訓練,最高可支持萬億參數超大模型的訓練。
在通過各類資源的精準組合來保證大模型訓練效果這一方面,商湯科技已經用實踐證明了自己的實力。
以商湯科技在2023年初開源的多模態多任務通用大模型“書生(INTERN)2.5”為例,書生2.5擁有30億參數,是目前全球開源模型中ImageNet準確度最高、規模最大,同時也是物體檢測標桿數據集COCO中唯一超過65.0 mAP(全類平均正確率)的模型。
至今,SenseCore已支持了超過10個大模型訓練項目,其中包括語言大模型、文生圖模型、視覺大模型、多模態模型等商湯自研模型和客戶自定義模型。
在服務8家客戶進行大模型訓練的過程中,商湯SenseCore AI大裝置總共提供了7000多張GPU。
追尋技術最高目標的“長跑”
如果說近期各類大模型的興起,敲開了通用人工智能的大門,那么,什么時候才能實現真正的通用人工智能?
對這個問題,還沒有人能給出答案。就像OpenAI(ChatGPT大語言模型的研發機構)創始人Sam Altman說的那樣:“我對此只有一個新的認識,那就是它不會是一蹴而就,而將是一個漸進的過程。也就是“緩慢起飛”。人們對什么時候能實現AGI,不會達成共識?!?/p>
不過,可以確定的是,我們正處在不斷逼近技術終極目標的長征路上。每一項人工智能的技術創新,都有望成為哺育新興業態、促進既有商業模式煥新、解放生產力的一片肥沃土壤。
據Gartner預測,至2023年將有20%的內容被生成式AI所創建;至2025年生成式AI產生的數據將占所有數據的10%(目前不到1%)。另據紅杉預測生成式AI將產生數萬億美元經濟價值,到2025年,國內生成式AI應用規模有望突破2000億。
而在這條通往通用人工智能的路上,唯一的“鑰匙”就是堅持研發和投入,秉持不斷試錯和調整步伐的耐心與決心。
從2014年成立開始,商湯科技已然踏足這條對技術終極目標的追逐之路,成為整個產業中的標桿玩家。未來,商湯科技仍將繼續這場“長跑”。
商湯科技表示,未來公司將繼續把實現通用人工智能作為核心發展戰略,并從5大方面進行深入挖掘和探索。
具體來說,公司將以SenseCore AI大裝置作為大模型生產的核心平臺,持續擴展大裝置的能力,包括投資高性能計算基礎設施例如高速網絡、大規模數據存儲以及強大的計算節點。
商湯科技還計劃將多模態大模型的研發作為戰略投入方向,不斷提升大模型的數據理解和生成能力、多任務泛化能力。
另外,商湯將與全球領先的芯片制造商、全球研究機構、高校和企業展開合作,共同探索算力優化的新途徑,推動AI算力的發展。
為了確保AI技術的發展惠及全人類,致力于降低AI技術的成本和門檻,商湯科技將通過開源項目、共享資源和合作研究等方式,與全球AI研究者和開發者共同推進AI技術的發展。
在商業化角度,商湯科技將推進大裝置和大模型能力對智慧生活、智能汽車、智慧商業、智慧城市四大板塊賦能。通過充分利用大模型的能力,不斷升級、強化四大業務線產品矩陣,提高產品競爭力,以商業化為抓手提升人工智能在各行各業的應用。
市場熱情如潮水般時漲時落,而對硬科技企業而言,追逐熱點勢必難以攀上技術的高峰。想要達到技術的下一階段,堅持長期主義才是唯一的方法論。
就像商湯科技董事長、首席執行官徐立在接受采訪時曾提到的:“商湯科技優勢在于長線的人工智能發展思維及商業落地的能力。我始終認為,技術運用到行業中是有工業使用的紅線。如果技術沒有達到紅線,就很難發揮商業價值。”
在真正到達通用人工智能的“彼岸”之前,AI產業中還需要更多如商湯科技一般的玩家,對長期主義施以實踐。
參考文獻:
《人工智能推動世界前行》,新華訪談
作者 | 董溫淑
編輯 | 董雨晴