每日經濟新聞 2023-04-27 15:50:27
每經編輯 蒙錦濤
在此前的商湯技術交流日上,商湯公布了前沿的人工智能“日日新SenseNova”大模型體系,基于該體系的AI內容創作社區平臺“商湯秒畫SenseMirage”也一并亮相。
值得注意的是,對于有進階需求的模型創作者,秒畫平臺也可支持自行上傳數據集進行finetune、自訓練等功能,定制訓練屬于自己風格的LoRA模型。基于現有商湯自研的文生圖模型的高度泛化性,B端用戶只需要拖拽20張左右的圖片作為訓練集,最少僅需5分鐘就能完成一個高質量模型的訓練,顯著降低模型的訓練門檻。
商湯集團智慧決策與游戲事業部總經理兼高級研究總監劉宇介紹,商湯的平臺想做的是集模型、訓練、推理和交流的一體化社區,相比于目前市面上直接去做純文字到圖像生成的產品,在目標和方向上有較大差別。
“自研+開源”共筑秒畫差異化優勢
“我們的核心競爭力應該在于我們打包了商湯自研的大模型、模型訓練跟推理的加速,以及我們整個底層的專利,對于用戶來說,使用、體驗的友好度都較好。”
在此前的商湯技術交流日上,商湯公布了前沿的人工智能研發成果“日日新SenseNova”大模型體系,以及基于該模型體系的多款AI應用產品。
商湯科技董事長兼CEO徐立在現場演示了“商湯秒畫SenseMirage”基于商湯自研AIGC模型的作畫能力,也介紹了秒畫平臺基于商湯大裝置的GPU算力支撐,可幫助用戶免除本地化部署流程,既能使用商湯自研作畫模型高效地生成高質量內容,也可以將本地模型及其他第三方開源模型一鍵導入,生成更多樣的內容。
同時,在市場AIGC產品普遍主打的文生圖能力之外,秒畫主要瞄準B端用戶,提供特異性推理優化服務,用戶將開源模型導入后會自動采用秒畫底層的模型編譯技術進行加速,實測在本地RTX3070顯卡需要10秒生成的圖片通過秒畫加速技術只需要2秒的推理時間就可以生成。
此外,秒畫還支持用戶上傳本地圖像,結合商湯自研作畫模型或者開源模型來訓練定制化LoRA模型,高效地生成個性化內容。
商湯集團智慧決策與游戲事業部總經理兼高級研究總監劉宇表示,除了商湯自研的文生圖能力,秒畫平臺還支持導入第三方的模型,并且能提供特異性加速功能,這也展示了商湯對于開源模型的加速能力。
通過“自研+開源”的模式,商湯的秒畫平臺將徹底區別于市面上現有的文生圖產品,拓展用戶服務的邊界。基于秒畫,用戶在簡單的文生圖功能之外,也能夠基于商湯的基模型,更低門檻地對自有小模型進行訓練、加速。
劉宇也表示,首先從產品層面來講,秒畫與市面上其他產品相比,AI繪圖只是其功能之一,“我們想做的事可能跟他們不太一樣,我們并不是想做一個輸入一句話,就能生成一張圖的功能。因為這種功能的商業價值并不是非常的大和完備,我們想做的是一個平臺。”
從平臺角度看,劉宇認為,秒畫具有三大核心能力。首先是來自商湯本身的自研大模型,除了文生圖能力之外,商湯更希望幫助用戶能夠基于商湯本身強大的平臺算力及大模型能力,去微調用戶自己的大模型,“從長期的商業價值上看,我們更想去給小B或者大B端客戶提供更強的基模型,使得他們能夠在自有領域基于商湯的基礎模型產生更好的垂類大模型,去產生他們的商業價值。”
秒畫的另一個優勢則來自商湯自身強大的算力能力。劉宇介紹,基于商湯本身的算力能力,秒畫作為一個平臺,用戶能夠選擇使用商湯的模型、自訓練的模型,或開源模型,同時,秒畫將為用戶提供模型特異性加速服務,通過秒畫平臺的模型編譯技術,自動分析用戶上傳的模型結構參數,把它和底層的GPU加速算子進行模型編譯,縮短模型的生成速度。“這是我們平臺的第二大優勢,也是商湯的傳統優勢,我們在大模型到小模型的推力加速方面有非常深厚的技術積累。”劉宇表示。
另外,商湯希望基于開源功能打造模型社區。“開源界現在有很多的討論,像AI作畫的模型,很多都是基于之前的模型去微調出來的。”劉宇介紹,商湯想整合、健全目前相對復雜的AI作畫社區,未來基于秒畫平臺,用戶可以利用商湯的基模型或基于其他前置模型訓練自有模型,平臺內部都會保留模型的依賴鏈條,進而保障原始模型作者的權益。
大模型+大算力超前布局
各家對于AIGC的競逐趨于白熱化,商湯的壁壘來自哪里?
劉宇認為,大模型要足夠好有三個核心要素,首先是模型參數量要夠大能保證泛化上限足夠高,二是在同等參數量下,網絡結構設計要足夠高效。“怎么保證在同等大的體量下,我們的模型能夠比其他的大模型性能要強,這需要我們在大模型神經網絡的結構設計上做很多的工作。”
第三,大模型的訓練穩定性需要被保障,劉宇介紹,“特別大的模型在優化上有一個非常嚴重的問題,當這個模型特別大,訓練一個任務所需要的GPU就會非常多(上千張的時候),訓練的穩定性就會變差,具體體現在大模型的收斂性、模型+數據3D并行的系統效率和千卡通信的穩定性上。”而商湯已經在大模型方面有非常多的技術積累,使得包括秒畫在內的AIGC大模型,能夠在一個很長的周期內,保持平穩訓練狀態,進而保證模型訓練的效率。
算法、算力、數據,如今已經成為人工智能領域的寶藏,而商湯的布局則更加前瞻。這也是商湯如今在大模型領域快速建立差異化優勢的核心原因。
在算力層面,2018年開始,商湯在自建算力中心的基礎上,打造了SenseCore商湯AI大裝置的“原型機”,開始攻克算力難題。到2020年,商湯再度斥資56億元,在上海臨港建設AIDC人工智能計算中心。2022年1月,AIDC正式開始運營。
目前,商湯SenseCore AI大裝置持續擴建,完成了2.7萬塊GPU的部署并實現了5.0 exaFLOPS的算力輸出能力,以AI-as-a Service(AIaaS)的模式面向行業伙伴提供服務。目前最多可支持20個千億參數量大模型(以千卡并行)同時訓練,最高可支持萬億參數超大模型的訓練。
基于商湯自研的AI大裝置,在大模型站上風口之前,商湯對于大模型的推理部署、增量訓練已經是其常規業務。目前,商湯大模型的推理部署可以將推理的效率提升100%以上;基于大裝置,商湯將大模型微調的成本降低至原來的1/10。
未來,大裝置有望成為人工智能大模型時代的重要基礎設施。扎根“大模型+大裝置”的技術路徑,商湯在這一輪AIGC機遇來臨時,也更加得心應手。
顯著降低B端使用門檻
商湯正在加速向其“賦能百業”的愿景靠近,AIGC時代,包括秒畫在內的系列平臺,將成為其中的重要一環。
劉宇認為,秒畫是一個更快且效果更好的基模型,同時商湯更進一步,為B端用戶提供SaaS和API的推理服務。“基于秒畫平臺的推理、特異性加速模型編譯技術和商湯大算力的基礎設施,服務下游的客戶,把我們的推理能力和模型能力用在它的垂類里面,這是我們的一個愿景。”劉宇表示。
從秒畫目前建立的差異化優勢來看,秒畫對于B端用戶而言,將是一個更加“友好”的AIGC平臺,這也意味著商湯面臨的商業化前景將更加明朗。
在企業數字化轉型的過程中,中小企業面臨的數字化門檻成為其轉型的阻礙之一。劉宇認為,商湯提供的秒畫等平臺,核心目的就是為了降低AIGC和大模型的微調訓練門檻,讓技術能夠在不具有這么多GPU或者甚至不具有這類專業知識的中小B端的廠商、用戶里產生價值。
劉宇介紹,去年商湯在AIGC層面已經有非常多的B端用戶,“當時更多的是他們給需求,我們給他定制化,用商湯的技術能力和集成訓練模型交付給他們,這也是AI平臺型行業的傳統做法。”劉宇表示,“現在商湯希望能夠通過秒畫這樣的平臺,讓用戶自身可以以更低的門檻,不需要采購GPU、不需要技術的理解和能力,僅僅通過一個網站的UI就可以生產自己的模型做推理部署。”
成本層面,劉宇算了一筆賬,用最小的訓練大模型的硬件加上研究員的人力成本來計算,“基于生成質量相對較差的開源大模型,然后招一個研究員,買上幾臺服務器把它訓練成企業自己的模型,至少應該百萬以上的成本。但是如果利用商湯的平臺,在數據一致的情況下,可能就只需要付出幾千甚至幾百元的成本,就可以得到一個相同甚至更好的模型。”
劉宇認為,商湯的產品從使用門檻和資金成本門檻上,都對B端用戶有了一個非常大的體驗上的飛躍。
浙商證券認為,以“秒畫”為例,產品實現了2秒出圖,不需要額外編程和調試,用戶可自定義生成圖片的數量、分辨率、長寬比等,生成效果優越,整體體驗可對標Midjourney。“我們認為,商湯因其發展歷史和業務特點,在CV領域擁有行業領先地位,是其跨模態模型三維化表現超預期的核心原因,可將其與文心一言等產品區別開來。”
在算力、算法等核心能力層面,商湯優勢明顯,對于商湯而言,通過“大模型+大算力”提供解決方案,能夠吸引更多下游用戶投入模型迭代,也有助于商湯進一步積累相關數據,提升產品迭代速率與產品體驗,進而加速商業化布局,反哺公司業績。
(文章內容僅供參考,不構成投資建議。投資者據此操作,風險自擔。)
編輯|蒙錦濤
如需轉載請與《每日經濟新聞》報社聯系。
未經《每日經濟新聞》報社授權,嚴禁轉載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯系索取稿酬。如您不希望作品出現在本站,可聯系我們要求撤下您的作品。
歡迎關注每日經濟新聞APP