2023年,來(lái)自千行百業(yè)的企業(yè)關(guān)注生成式AI、尋找應(yīng)用場(chǎng)景;2024年,他們中的領(lǐng)先者實(shí)踐生成式AI、進(jìn)行場(chǎng)景實(shí)驗(yàn);2025年,那些繼續(xù)保持領(lǐng)先的企業(yè),將轉(zhuǎn)向生產(chǎn)階段,走向生成式AI應(yīng)用的“深水區(qū)”,尋求商業(yè)價(jià)值回報(bào)。誰(shuí)來(lái)為這些企業(yè)護(hù)航,又怎么護(hù)航?
能力越大,責(zé)任越大,為全球百萬(wàn)客戶提供安全可靠云服務(wù)、連續(xù)13年被Gartner評(píng)為“全球云計(jì)算領(lǐng)導(dǎo)者”的亞馬遜云科技,先承擔(dān)了這份“護(hù)航”的重任。在2024 re:Invent全球大會(huì)上,亞馬遜云科技推出一系列技術(shù)發(fā)布,以覆蓋基礎(chǔ)設(shè)施、模型和應(yīng)用的全棧聯(lián)動(dòng)創(chuàng)新助力企業(yè)應(yīng)用生成式AI,全面重塑客戶云上創(chuàng)新體驗(yàn)。
在亞馬遜云科技2024 re:Invent中國(guó)行北京站,亞馬遜云科技大中華區(qū)產(chǎn)品部總經(jīng)理陳曉建表示:“今年re:Invent全球大會(huì)的一系列重磅發(fā)布,我們不僅在云的核心服務(wù)層面持續(xù)創(chuàng)新,更在從芯片到模型,再到應(yīng)用的每一個(gè)技術(shù)堆棧取得突破,讓不同層級(jí)的創(chuàng)新相互賦能、協(xié)同進(jìn)化。只有這樣全棧聯(lián)動(dòng)的大規(guī)模創(chuàng)新才能真正滿足當(dāng)今客戶的發(fā)展需求,加速前沿技術(shù)的價(jià)值釋放,助力各行各業(yè)重塑未來(lái)?!?/p>
(亞馬遜云科技大中華區(qū)產(chǎn)品部總經(jīng)理陳曉建,圖源:亞馬遜云科技)
三大領(lǐng)域技術(shù)矩陣,直面未來(lái)復(fù)雜需求
“2024年我們看到許多客戶從思考階段進(jìn)入實(shí)踐階段,進(jìn)行了大量場(chǎng)景試驗(yàn)。但是我覺(jué)得2025年肯定會(huì)發(fā)生一個(gè)變化,很多客戶將從原型驗(yàn)證階段轉(zhuǎn)化為生產(chǎn)階段,這是必經(jīng)之路。屆時(shí)客戶需求將更加復(fù)雜,不僅是選擇模型,還需要各種技術(shù)支持?!标悤越ū硎?。
實(shí)踐層面,亞馬遜云科技在2024 re:Invent全球大會(huì)上的一系列技術(shù)發(fā)布,聚集生成式AI、數(shù)據(jù)戰(zhàn)略和云服務(wù)三大領(lǐng)域。
整體來(lái)看,這些新發(fā)布更加側(cè)重于產(chǎn)品的實(shí)際應(yīng)用和工具優(yōu)化,這是對(duì)全球用戶積極使用亞馬遜云科技進(jìn)行生成式AI應(yīng)用探索和創(chuàng)新的全新反饋。
沙利文大中華區(qū)總監(jiān)李慶表示:“本次更新有兩個(gè)方面讓我印象深刻:一是隨著全球企業(yè)對(duì)生成式AI的深入應(yīng)用,數(shù)據(jù)不僅實(shí)現(xiàn)跨區(qū)域的傳輸與協(xié)同,更實(shí)現(xiàn)跨地域、跨區(qū)域的深度連接;二是亞馬遜云科技進(jìn)一步優(yōu)化生成式AI的應(yīng)用,從數(shù)據(jù)存儲(chǔ)、治理到管理的全流程提升,旨在簡(jiǎn)化AI對(duì)數(shù)據(jù)的使用,同時(shí)強(qiáng)化模型功能、增加AI agent管理和應(yīng)對(duì)模型幻覺(jué)的功能?!?/p>
技術(shù)“高能”的同時(shí),在當(dāng)天的溝通環(huán)節(jié),陳曉建和亞馬遜云科技大中華區(qū)數(shù)據(jù)分析與生成式AI的產(chǎn)品總監(jiān)崔瑋,還多次提到了獲得的“成本”與使用的“便捷”,這些在具體的創(chuàng)新中都有體現(xiàn)。
生成式AI:基礎(chǔ)設(shè)施、模型、應(yīng)用的全進(jìn)化
具體而言,在生成式AI領(lǐng)域,亞馬遜云科技全面強(qiáng)化基礎(chǔ)設(shè)施、模型和應(yīng)用三層技術(shù)棧能力,幫助企業(yè)更輕松、更經(jīng)濟(jì)地將生成式AI應(yīng)用于實(shí)際業(yè)務(wù)場(chǎng)景。
基礎(chǔ)設(shè)施方面,突出能力。推出Amazon SageMaker AI的四項(xiàng)創(chuàng)新,包括新訓(xùn)練配方、靈活訓(xùn)練計(jì)劃和任務(wù)治理功能,以及在Amazon SageMaker中使用亞馬遜云科技合作伙伴的熱門AI應(yīng)用。幫助客戶更快構(gòu)建、訓(xùn)練、部署流行模型,節(jié)省數(shù)周時(shí)間并將成本降低最高40%。
模型方面,豐富選擇。一方面推出Amazon Nova基礎(chǔ)模型矩陣,突出的是對(duì)基礎(chǔ)模型成本的大幅降低。包括Nova Micro、Nova Lite、Nova Pro和Nova Premier基礎(chǔ)模型,以及用于生成高質(zhì)量圖像的Nova Canvas和生成高質(zhì)量視頻的Nova Reel。在各自智能類別中,Amazon Nova Micro、Lite和Pro應(yīng)用成本比Amazon Bedrock中表現(xiàn)最佳的模型至少降低75%,同時(shí)也是其中對(duì)應(yīng)類別速度最快的模型。
另一方面,Amazon Bedrock平臺(tái)能力全面升級(jí)。新接入100多款熱門、新興及專業(yè)模型,并推出AI防護(hù)、多智能體協(xié)作和模型蒸餾等重磅更新,全面優(yōu)化推理場(chǎng)景的準(zhǔn)確性、成本和響應(yīng)速度。
應(yīng)用方面,延伸場(chǎng)景。Amazon Q更加深入軟件開發(fā)和商業(yè)應(yīng)用場(chǎng)景,Amazon Q Developer增加三款新的智能體,能自動(dòng)執(zhí)行單元測(cè)試、文檔編制和代碼審查流程,并通過(guò)與GitLab深度集成,擴(kuò)展應(yīng)用場(chǎng)景;推出轉(zhuǎn)型功能以加速Windows.NET、VMware和大型機(jī)工作負(fù)載的遷移和現(xiàn)代化,縮短轉(zhuǎn)型時(shí)間并降低成本。強(qiáng)化了Amazon Q Business和Amazon Q in QuickSight洞察能力,并簡(jiǎn)化了復(fù)雜工作流程的自動(dòng)化實(shí)現(xiàn)方式。
數(shù)據(jù)戰(zhàn)略:體驗(yàn)升級(jí),統(tǒng)一平臺(tái)釋放數(shù)據(jù)價(jià)值
數(shù)據(jù)戰(zhàn)略領(lǐng)域,亞馬遜云科技推出新一代Amazon SageMaker,能夠?yàn)榭蛻籼峁﹩我坏臄?shù)據(jù)和AI開發(fā)環(huán)境,用戶可以在其中查找和訪問(wèn)其組織中的所有數(shù)據(jù),為各種常見的數(shù)據(jù)用例選擇最佳工具,并將數(shù)據(jù)和AI項(xiàng)目擴(kuò)展至團(tuán)隊(duì)內(nèi)不同分工角色以實(shí)現(xiàn)協(xié)作。
Amazon SageMaker Lakehouse,能夠?qū)崿F(xiàn)數(shù)據(jù)湖、數(shù)據(jù)倉(cāng)庫(kù)、運(yùn)營(yíng)數(shù)據(jù)庫(kù)和企業(yè)應(yīng)用程序中數(shù)據(jù)的統(tǒng)一管理,支持客戶使用熟悉的AI和機(jī)器學(xué)習(xí)工具或Apache Iceberg兼容的查詢引擎進(jìn)行訪問(wèn)和處理。
云服務(wù):全棧聯(lián)動(dòng)創(chuàng)新,提供更強(qiáng)大底層支持
云服務(wù)領(lǐng)域,亞馬遜云科技在計(jì)算、網(wǎng)絡(luò)、存儲(chǔ)和數(shù)據(jù)庫(kù)等核心領(lǐng)域持續(xù)創(chuàng)新,為各類工作負(fù)載提供更強(qiáng)大的底層支持。
計(jì)算部分,繼續(xù)憑借自研芯片引領(lǐng)算力創(chuàng)新?;贏mazon Trainium2的EC2 Trn2實(shí)例正式可用,較當(dāng)前GPU實(shí)例性價(jià)比提升30-40%;推出配備64個(gè)Trainium2芯片的EC2 Trn2 UltraServers服務(wù)器,提供高達(dá)83.2 Petaflops浮點(diǎn)算力,計(jì)算能力是單一實(shí)例的四倍。在大規(guī)模訓(xùn)練方面,Project Rainier集群搭載數(shù)十萬(wàn)個(gè)Trainium2芯片,算力超越以往集群5倍以上。采用3納米工藝的下一代Trainium3芯片預(yù)計(jì)將在2025年末上線,預(yù)計(jì)將使集群性能提升4倍,并在性能、能效和密度上樹立新標(biāo)桿。
網(wǎng)絡(luò)部分,升級(jí)基礎(chǔ)設(shè)施。推出第二代UltraCluster網(wǎng)絡(luò)架構(gòu),支持超過(guò)20000個(gè)GPU協(xié)同工作,帶寬達(dá)10Pb/s,延遲低于10ms,將模型訓(xùn)練時(shí)間縮短至少15%。
存儲(chǔ)部分,增強(qiáng)數(shù)據(jù)處理能力。Amazon S3新增Metadata元數(shù)據(jù)功能實(shí)現(xiàn)自動(dòng)獲取和實(shí)時(shí)更新;推出專為Iceberg表優(yōu)化的S3 Tables存儲(chǔ)類型,將查詢性能提升3倍,事務(wù)處理能力提升10倍。
數(shù)據(jù)庫(kù)部分,全新的無(wú)服務(wù)器分布式SQL數(shù)據(jù)庫(kù)Amazon Aurora DSQL,采用active-active架構(gòu)并具備自動(dòng)故障恢復(fù)功能,支持應(yīng)用程序在任意端點(diǎn)進(jìn)行讀寫。它不僅提供99.999%的多區(qū)域可用性,還能實(shí)現(xiàn)近乎無(wú)限的可擴(kuò)展性,且無(wú)需進(jìn)行數(shù)據(jù)庫(kù)分片或?qū)嵗?jí)。Amazon DynamoDB global tables增加了多區(qū)域強(qiáng)一致性支持,進(jìn)一步增強(qiáng)了其分布式數(shù)據(jù)庫(kù)服務(wù)能力。
解決“幻覺(jué)”,讓企業(yè)無(wú)憂推進(jìn)生成式AI生產(chǎn)應(yīng)用
除了以上內(nèi)容,更好地應(yīng)對(duì)模型“幻覺(jué)”,更多企業(yè)才能沒(méi)有顧慮地推進(jìn)生成式AI的生產(chǎn)應(yīng)用,因?yàn)樵诒姸嗟恼鎸?shí)場(chǎng)景中,容不得紕漏,生成的內(nèi)容一旦與現(xiàn)實(shí)世界事實(shí)或用戶輸入不一致,可能造成難以挽回的損失,像是金融、醫(yī)療、法律領(lǐng)域尤其如此。
解決“幻覺(jué)”,才能讓企業(yè)有信心將生成式AI從原型驗(yàn)證推向生產(chǎn)應(yīng)用,也是充分釋放性能的前提。亞馬遜云科技探索了多種不同的技術(shù)方案發(fā)現(xiàn)自動(dòng)推理技術(shù)(Automatic Reasoning)能夠很有效的解決“幻覺(jué)”問(wèn)題,提升內(nèi)容生成的安全性與準(zhǔn)確定。
例如,可以通過(guò)自動(dòng)推理來(lái)證明說(shuō)在整個(gè)Amazon IAM之中設(shè)計(jì)的權(quán)限和策略是不是按照所預(yù)想的方式進(jìn)行的,從而獲得可證明的安全性;推出的Amazon Bedrock 自動(dòng)化推理檢查的功能,則能夠有效的去預(yù)防由于模型幻覺(jué)帶來(lái)的事實(shí)性錯(cuò)誤。
整體來(lái)看,亞馬遜云科技將持續(xù)助力各行各業(yè)加速創(chuàng)新,突破既有范式,重塑未來(lái)。(丁科技網(wǎng)原創(chuàng),轉(zhuǎn)載務(wù)必注明“來(lái)源:丁科技網(wǎng)”)
- QQ:61149512