IBM 稱大型機(jī)和人工智能是不可或缺的搭檔

至頂網(wǎng)計算頻道
經(jīng)過六十年的發(fā)展,大型機(jī)已成為存儲和處理大量關(guān)鍵業(yè)務(wù)數(shù)據(jù)的支柱。在企業(yè)開始人工智能驅(qū)動數(shù)字化轉(zhuǎn)型之旅之際,大型機(jī)將在提升數(shù)據(jù)價值方面發(fā)揮關(guān)鍵作用。

本文來自至頂網(wǎng)(server.zhiding.cn),來源 | 至頂網(wǎng)計算頻道。

藍(lán)色巨人希望科技行業(yè)用旗下的大型主機(jī)運(yùn)行人工智能工作負(fù)載。

IBM商業(yè)價值研究院日前發(fā)布一份長達(dá)28頁題為“大型機(jī)是數(shù)字化轉(zhuǎn)型的支柱”的報告。報告發(fā)現(xiàn),79%的IT高管都認(rèn)為大型主機(jī)對于實(shí)現(xiàn)人工智能驅(qū)動的創(chuàng)新至關(guān)重要。報告指出,經(jīng)過六十年的發(fā)展,大型機(jī)已成為存儲和處理大量關(guān)鍵業(yè)務(wù)數(shù)據(jù)的支柱。在企業(yè)開始人工智能驅(qū)動數(shù)字化轉(zhuǎn)型之旅之際,大型機(jī)將在提升數(shù)據(jù)價值方面發(fā)揮關(guān)鍵作用。

IBM的擔(dān)憂似乎在于,大型機(jī)用戶不應(yīng)該假定現(xiàn)代、生成性人工智能工作負(fù)載只是可以在公共云和/或企業(yè)數(shù)據(jù)中心中的x86和GPU服務(wù)器上運(yùn)行。大型機(jī)同樣也可以運(yùn)行這一類的人工智能工作負(fù)載。

筆者在出版前有幸讀了這份報告。報告的著筆點(diǎn)是大型機(jī)-公有云-邊緣的混合方法,需將工作負(fù)載放在最合適的平臺上。人工智能可用于加速大型機(jī)應(yīng)用程序現(xiàn)代化、增強(qiáng)事務(wù)性工作負(fù)載和改善大型機(jī)運(yùn)營。報告稱,“將企業(yè)內(nèi)部大型機(jī)與超大規(guī)模機(jī)相結(jié)合,可以創(chuàng)建一種集成運(yùn)營模式。這種運(yùn)營模式可以實(shí)現(xiàn)敏捷實(shí)踐和促進(jìn)應(yīng)用程序之間的互操作性。”

報告建議大型機(jī)用戶“利用人工智能獲取交易之間的洞察,以增強(qiáng)業(yè)務(wù)用例,包括欺詐檢測、反洗錢、信貸決策、產(chǎn)品推薦、動態(tài)定價和情感分析”。

大型機(jī)性能可以提升基于規(guī)則的人工智能信用評分,一家北美銀行在公共云僅對20%的信用卡交易進(jìn)行評分,每筆交易耗時80毫秒,而將應(yīng)用程序遷移到大型機(jī)上則能夠?qū)崿F(xiàn)100%信用卡交易的評分,每秒可處理15,000筆交易,每筆交易耗時2毫秒,預(yù)計每年可節(jié)省2000萬美元的防欺詐支出。

大型機(jī)配備了嵌入式片上人工智能加速器,“可以擴(kuò)展到以極低的延遲每秒處理數(shù)百萬個推理請求,這對于交易型人工智能用例(如檢測支付欺詐)尤為重要”。IBM表示,“傳統(tǒng)人工智能可用于評估銀行支付是否存在欺詐行為,而大型語言模型(LLM)則可用于提高預(yù)測的準(zhǔn)確性。”

IBM的Ensemble AI(組合人工智能)方法就是這樣做的:將現(xiàn)有的機(jī)器學(xué)習(xí)模型與更新的LLM結(jié)合起來。

人工智能可用于改善大型機(jī)管理。報告發(fā)現(xiàn),“74%的高管認(rèn)為,將人工智能整合到大型機(jī)運(yùn)營中并改變系統(tǒng)管理和維護(hù)非常重要。基于人工智能的自動化、預(yù)測分析、自我修復(fù)和自我調(diào)整等功能可以主動檢測和預(yù)防問題,優(yōu)化工作流程,提高系統(tǒng)的可靠性。”

大型機(jī)可以利用人工智能進(jìn)行監(jiān)控、分析、檢測和應(yīng)對網(wǎng)絡(luò)威脅。此外,生成式人工智能大型語言模型和代碼助手可以加速舊編碼語言(Cobol)的工作,例如轉(zhuǎn)換為Java和JCL開發(fā),從而“通過使開發(fā)人員能夠更快、更高效地實(shí)現(xiàn)現(xiàn)代化或構(gòu)建應(yīng)用程序,縮小大型機(jī)的技能差距”。

IBM將在2025年推出的下一代z16大型機(jī)中采用人工智能專用DPU(數(shù)據(jù)處理單元),從而實(shí)現(xiàn)人工智能處理卸載的方法。該系統(tǒng)將配備多達(dá)32個Telum II處理器,支持以24 TOPS的速度進(jìn)行片上人工智能推理加速。Spyre加速器將增加32個人工智能加速器核和1GB DRAM,其性能與Telum II片上人工智能加速器相當(dāng)。在下一代大型機(jī)中,最多可以與Telum II單元一起使用8個人工智能加速器。

不過,藍(lán)色巨人并未打算在旗下大型機(jī)架構(gòu)中添加GPU。推理工作負(fù)載將在大型機(jī)上有效運(yùn)行,但人工智能訓(xùn)練工作負(fù)載則不然。我們可以期待IBM會有一些實(shí)現(xiàn)進(jìn)行大型機(jī)矢量化和矢量數(shù)據(jù)庫功能的安排,以支持推理工作負(fù)載中的檢索增強(qiáng)生成(RAG)。

對于筆者而言,為大型機(jī)添加GPU是一個重要的終極目標(biāo),原因是大型機(jī)配備了GPU就打開了在大型機(jī)這個經(jīng)典的大型平臺上運(yùn)行人工智能訓(xùn)練工作負(fù)載的大門?;蛟S,GPU協(xié)處理器的概念將成為z17大型機(jī)的賣點(diǎn)。

THEEND

最新評論(評論僅代表用戶觀點(diǎn))

更多
暫無評論