通信世界網(wǎng)消息(CWW)今年7月,全球迎來了世界氣象組織評價史上最熱的7月。不少人戲謔:全球變暖的時代還未結(jié)束,全球“沸騰”的時代已然到來。和高溫同樣讓人“沸騰”的,還有業(yè)界紛紛加碼的大模型產(chǎn)業(yè)。TeleChat、九天、鴻湖……一夜之間,國內(nèi)三大運營商成為千億級數(shù)據(jù)大模型的玩家,大秀各自的AI“肌肉”。
不僅運營商,各大科技公司、互聯(lián)網(wǎng)企業(yè)也開始了“明爭暗斗”,大模型成為了各家蜂擁而上的“新熱土”。一時間,大模型產(chǎn)業(yè)“群模亂舞”。時至年終,寒冬已至,火熱的大模型依然沒有降溫。
“以大模型為代表的人工智能發(fā)展呈現(xiàn)出技術(shù)創(chuàng)新快、應(yīng)用滲透強、國際競爭激烈等特點,展現(xiàn)出強大的賦能效應(yīng)?!惫ば挪肯嚓P(guān)負(fù)責(zé)人日前介紹說,我國100億級參數(shù)規(guī)模以上的大模型超過10個,10億級參數(shù)規(guī)模以上的大模型近80個,大模型數(shù)量位居世界第一梯隊。
在此背景下,AI大模型逐漸走向深挖應(yīng)用階段,行業(yè)大模型已經(jīng)成為其中不可忽視的組成部分。
行業(yè)大模型是面向用戶的“商品房”
OpenAI的ChatGPT橫空出世,讓大模型成為人們耳熟能詳?shù)臒嵩~。那么,何為大模型?根據(jù)分析機構(gòu)定義,大模型是大規(guī)模語言模型(Large Language Model)的簡稱,是指具有龐大的參數(shù)規(guī)模和極高復(fù)雜程度的機器學(xué)習(xí)模型,可以提供更強大、更準(zhǔn)確的模型性能,以應(yīng)對更復(fù)雜、更龐大的數(shù)據(jù)集或任務(wù)。一般而言,大模型包括通用大模型、行業(yè)大模型等。
如果說通用大模型是大模型中的“樣板間”,那么行業(yè)大模型就是可以直面用戶的“商品房”。如今,探索賦能不同行業(yè)場景的落地方式與應(yīng)用價值已成為大模型的發(fā)展方向。
受益于技術(shù)能力的提升和多樣化的場景需求,大模型如今是人工智能領(lǐng)域的動力之源,成為推動人工智能從技術(shù)積累、行業(yè)應(yīng)用、產(chǎn)業(yè)變革發(fā)展到賦能千行百業(yè)的基礎(chǔ)設(shè)施。但是,通用大模型在一定程度上難以滿足行業(yè)用戶的直接需求:首先是模型所包含的參數(shù)量巨大,模型的訓(xùn)練和部署對算力消耗也十分巨大,成本高昂;其次是模型的可解釋性仍然較弱,通常需要增加內(nèi)容管控手段以保證結(jié)果的安全性;最后是模型對訓(xùn)練數(shù)據(jù)的依賴性仍然很強,對于超出訓(xùn)練數(shù)據(jù)的任務(wù),完成效果不盡如人意。更為重要的是,在一些特定的行業(yè),通用基礎(chǔ)大模型的表現(xiàn)并不理想。
相比通用大模型偏向于滿足C端用戶要求,行業(yè)大模型與應(yīng)用場景結(jié)合得更緊密,業(yè)內(nèi)用戶可以直接使用,解決問題。同時,行業(yè)大模型的訓(xùn)練也相對容易,對算力和數(shù)據(jù)集的需求都比通用大模型低,并且數(shù)據(jù)集往往是訓(xùn)練者的自有數(shù)據(jù),可以降低成本、提高價值。
為此,在大模型這個充滿希望的市場上,前述眾多玩家開始聚焦行業(yè)大模型細分“賽道”。
“內(nèi)部應(yīng)用+核心行業(yè)”運營商的大模型布局
自主學(xué)習(xí)建筑設(shè)計的規(guī)則和要求,自動生成符合規(guī)范的建筑設(shè)計方案,根據(jù)用戶需求快速生成多樣化的效果圖,對建筑設(shè)計方案進行合規(guī)性和規(guī)范性檢查,預(yù)測建筑物的壽命以及維修、更新需求……這不是住建行業(yè)的設(shè)計師,而是中國電信與中國建科攜手發(fā)布的“星辰-住建”行業(yè)大模型。如今,用戶無需具備專業(yè)知識,只需通過與“星辰-住建”大模型進行連續(xù)對話,就可以修改調(diào)整自己的裝飾裝修設(shè)計,直到選出自己喜歡的方案。而“星辰-住建”行業(yè)大模型僅是中國電信“星辰”語義大模型首批試商用的12個行業(yè)大模型之一。
在7月“小試牛刀”后,三大運營商持續(xù)發(fā)力大模型產(chǎn)業(yè)。無論是中國電信的“TeleChat”“星辰”,中國移動的“九天”,還是中國聯(lián)通的“鴻湖”,都表明運營商的大模型更側(cè)重于行業(yè)場景。這些大模型不僅聚焦運營商內(nèi)部應(yīng)用,如智慧客服、智慧中臺等,也在融入垂直行業(yè)市場。
11月,中國電信發(fā)布了千億參數(shù)“星辰”語義大模型,其中包含了首批試商用的12個行業(yè)大模型,分別為星辰教育大模型、基層治理大模型、政務(wù)服務(wù)大模型、應(yīng)急大模型、醫(yī)保大模型、交通大模型、住建大模型、金融大模型、“神農(nóng)一號”大模型、出行大模型、旅游導(dǎo)覽大模型、礦山大模型。同時,中國電信推出了“慧聚”一站式智算服務(wù)平臺,讓大模型應(yīng)用生產(chǎn)變成了“流水線”,讓開發(fā)者能夠“開箱即用”,有效降低了開發(fā)門檻。
10月,中國移動推出“九天·眾擎基座大模型”,融合通信、能源、鋼鐵、建筑、交通等八大行業(yè)專業(yè)知識,定向加強行業(yè)能力,為企業(yè)“量體裁衣”構(gòu)建行業(yè)大模型和打造智能化應(yīng)用。
中國聯(lián)通的“鴻湖”大模型則是首個面向運營商增值業(yè)務(wù)的大模型,具備以文生圖、視頻剪輯、以圖生圖等多種功能。“鴻湖”是中國聯(lián)通首個“面向創(chuàng)新業(yè)務(wù)的大模型”,可以將不同模態(tài)內(nèi)容對齊到文本,以實現(xiàn)跨模態(tài)的內(nèi)容理解,為中國聯(lián)通基礎(chǔ)網(wǎng)絡(luò)、云計算能力、客戶服務(wù)、創(chuàng)新業(yè)務(wù)、安全防護等場景的智能化轉(zhuǎn)型升級奠定了基礎(chǔ)。據(jù)悉,中國聯(lián)通將于12月發(fā)布多個細分領(lǐng)域的行業(yè)大模型。
電信分析師金峰表示,三大運營商的大模型之所以側(cè)重上述核心行業(yè),主要是由于運營商在這些行業(yè)有著相對豐富的數(shù)據(jù)積累和相對完善的生態(tài)合作,可以獲得數(shù)據(jù)集用于訓(xùn)練??梢?,運營商結(jié)合自己的數(shù)據(jù)優(yōu)勢和用戶優(yōu)勢,利用大模型帶來的技術(shù)變革,有選擇地拓展行業(yè)大模型,能夠使已有服務(wù)更加智能化、智慧化。
頭部企業(yè)布局行業(yè)大模型走深向?qū)?/p>
除三大基礎(chǔ)運營商之外,在大模型這條“賽道”上,還擠進了很多科技公司和互聯(lián)網(wǎng)企業(yè),一場爭奪先機的“卡位賽”已然打響。
百度作為國內(nèi)大模型的領(lǐng)軍企業(yè)之一,除了“文心一言”之類的基礎(chǔ)大模型,還打造了11個行業(yè)大模型,覆蓋交通、能源、金融、汽車、政務(wù)等重點領(lǐng)域。
在能源電力領(lǐng)域,百度為世界上最大的電網(wǎng)——國家電網(wǎng)提供大模型技術(shù)。用AI來預(yù)測用電高峰,為電網(wǎng)調(diào)度提供建議,用無人機加圖像識別巡檢線路,保障供電平穩(wěn)。
在汽車制造領(lǐng)域,百度智能云為長安汽車提供了人工智能基礎(chǔ)設(shè)施平臺和數(shù)字人平臺,雙方正在開發(fā)一款基于“文心大模型”的生成式人工智能產(chǎn)品,賦能長安汽車的一款量產(chǎn)車型,以提升用戶體驗。同時,百度與吉利汽車一起打造汽車行業(yè)大模型,構(gòu)建了工廠數(shù)字化“大腦”,幫助吉利降低了30%管理運維成本,提高了20%資源利用效率。
同樣高效布局行業(yè)大模型“賽道”的企業(yè)還有科大訊飛,“星火認(rèn)知大模型V3.0”一經(jīng)推出就備受關(guān)注,與其一同發(fā)布的還有科大訊飛聯(lián)合各行業(yè)龍頭共同研發(fā)的多達12個行業(yè)大模型,涵蓋金融、汽車、運營商、工業(yè)、住建、物業(yè)、科普、科技文獻、政務(wù)、傳媒、文旅、水利等領(lǐng)域。以“星火大模型V3.0”為底座,科大訊飛有了進一步開拓行業(yè)大模型的基礎(chǔ)“1”。接下來,為適配不同行業(yè)需求,訊飛打造了一整套訓(xùn)練機制和工具,這就讓“1”和后面更多的“0”有了實現(xiàn)的可能。
在物業(yè)領(lǐng)域,科大訊飛與萬科合作推出了物業(yè)大模型,現(xiàn)已智慧服務(wù)全國3300多個小區(qū)。萬物云首席科學(xué)家丁險峰表示:“物業(yè)大模型首先致力于物業(yè)管理知識的普及,通過AI賦能消弭認(rèn)知差異,讓甲乙雙方更高效對話,促進行業(yè)高質(zhì)量發(fā)展?!痹谄囶I(lǐng)域,科大訊飛與奇瑞、廣汽等眾多廠商密切合作,讓大模型“上車”,賦能更生動、更有趣的汽車應(yīng)用開發(fā),推動汽車人機交互進入嶄新階段。
科大訊飛董事長劉慶峰在業(yè)內(nèi)會議上表示,科大訊飛并不是只能做12個行業(yè)大模型?!拔覀冇X得,要想把行業(yè)做透,就必須與真正懂行業(yè)、懂應(yīng)用、懂場景的龍頭企業(yè)聯(lián)合打造,并且彼此都有心胸和氣度能堅持把大模型打造完成,龍頭企業(yè)內(nèi)部用好以后就可以全行業(yè)賦能,這也是我們挑選合作者的基本原則。”
金峰表示,目前多家公司都在積極探索大模型在各行業(yè)的深度應(yīng)用,以大模型生成技術(shù)為核心,人工智能正在成為下一輪數(shù)字化發(fā)展的關(guān)鍵動力,為解決產(chǎn)業(yè)痛點帶來全新的思路。
生態(tài)體系仍需不斷完善
行業(yè)大模型都是基于本行業(yè)領(lǐng)域的數(shù)據(jù)進行訓(xùn)練和優(yōu)化,能夠更好地理解和處理專業(yè)術(shù)語、規(guī)范和語義。但是,行業(yè)大模型要最終在真實場景落地,并達到理想的服務(wù)效果,還應(yīng)充分解決行業(yè)用戶的痛點。騰訊云聯(lián)合中國信通院發(fā)布的《行業(yè)大模型標(biāo)準(zhǔn)體系及能力架構(gòu)研究報告》(以下簡稱《報告》)指出,目前行業(yè)用戶所面臨的問題包括計算資源少、數(shù)據(jù)質(zhì)量差、投入成本高、專業(yè)人才稀缺等。
在計算資源方面,大模型訓(xùn)練對計算資源和存儲資源提出較高要求,對于很多行業(yè)用戶而言門檻很高,現(xiàn)有的資源難以支持大模型的訓(xùn)練和推理。同時,高質(zhì)量的行業(yè)知識庫和訓(xùn)練數(shù)據(jù)是行業(yè)大模型構(gòu)建的關(guān)鍵要素,在模型訓(xùn)練過程中,需要大量高質(zhì)量的數(shù)據(jù)進行訓(xùn)練和優(yōu)化。
在數(shù)據(jù)質(zhì)量方面,行業(yè)用戶在模型訓(xùn)練過程中,經(jīng)常因各類數(shù)據(jù)質(zhì)量問題,導(dǎo)致模型訓(xùn)練的效果和效率無法得到保障。
在成本投入方面,為確保業(yè)務(wù)使用的效果和可持續(xù)性,行業(yè)用戶需要投入很高量級的數(shù)據(jù)、計算資源、專業(yè)技術(shù)和時間,用來訓(xùn)練、調(diào)試、優(yōu)化并部署大模型,成本極高。
在專業(yè)人才方面,行業(yè)用戶通常缺乏AI領(lǐng)域技術(shù)人才的儲備,模型的開發(fā)落地通常對技術(shù)人才有很高的要求,相關(guān)資源的缺失將影響大模型在行業(yè)的快速落地和持續(xù)優(yōu)化。
《報告》認(rèn)為,面對這些痛點和問題,需要行業(yè)大模型技術(shù)服務(wù)提供商提供行業(yè)大模型精調(diào)解決方案,幫助模型開發(fā)者與算法工程師,一站式解決數(shù)據(jù)的處理問題,高效率、高品質(zhì)、低成本地創(chuàng)建和使用大模型。滿足不同行業(yè)用戶的不同部署需求,支持私有化本地部署的方式,在權(quán)限管控、數(shù)據(jù)加密等方面提供完善的方案。技術(shù)服務(wù)提供商應(yīng)該為金融、文旅、政務(wù)、傳媒、教育等各領(lǐng)域用戶提供基礎(chǔ)行業(yè)大模型,便于行業(yè)用戶基于基礎(chǔ)模型進行便捷的精調(diào),以支持不同業(yè)務(wù)場景和應(yīng)用的開發(fā)。
展望未來,面向垂直領(lǐng)域、垂直行業(yè)、垂直場景的應(yīng)用探索必將是大模型競賽攻克的核心方向,而落地應(yīng)用的“井噴式”增長也將為大模型的迭代升級不斷注入“鮮活血液”,大模型產(chǎn)業(yè)的繁榮發(fā)展將帶來更多可能。行業(yè)大模型也為軟件架構(gòu)的演進革新注入新的活力,有望重塑全球數(shù)字化產(chǎn)業(yè)。
未來,隨著全球化和數(shù)字化趨勢的加強,行業(yè)大模型的應(yīng)用將更加廣泛和深入。這將為運營商和互聯(lián)網(wǎng)公司等帶來新的發(fā)展機遇,但也存在諸多挑戰(zhàn),包括技術(shù)更新?lián)Q代的速度、數(shù)據(jù)安全性,以及與其他行業(yè)的競爭和協(xié)同。而在這一過程中,如何定位并更好地打造自己的行業(yè)大模型,將成為決定其未來發(fā)展的關(guān)鍵。
- QQ:61149512