本文來自微信公眾號(hào)“Ai時(shí)代前沿”,作者/AI情報(bào)室。
根據(jù)Gartner公司的數(shù)據(jù),到2027年,40%的生成式人工智能(GenAI)解決方案將是多模態(tài)的(文本、圖像、音頻和視頻),而2023年這一比例為1%。這種從單一模型到多模態(tài)模型的轉(zhuǎn)變?cè)鰪?qiáng)了人類與人工智能的互動(dòng),并為GenAI產(chǎn)品的差異化提供了機(jī)會(huì)。
在美國黃金海岸舉行的Gartner IT研討會(huì)/展會(huì)上,Gartner杰出副總裁分析師Erick Brethenoux表示:“隨著GenAI市場(chǎng)向基于多種模態(tài)的本地訓(xùn)練模型發(fā)展,這有助于捕捉不同數(shù)據(jù)流之間的關(guān)系,并有可能將GenAI的優(yōu)勢(shì)擴(kuò)展到所有數(shù)據(jù)類型和應(yīng)用程序中。它還允許人工智能支持人類執(zhí)行更多任務(wù),而不管環(huán)境如何。”
多模態(tài)GenAI是Gartner在2024年生成式人工智能技術(shù)成熟度周期中確定的兩種技術(shù)之一,早期采用有可能帶來顯著的競(jìng)爭(zhēng)優(yōu)勢(shì)和上市時(shí)間效益。與開源大型語言模型(LLM)一起,這兩種技術(shù)在未來五年內(nèi)對(duì)組織具有很高的影響潛力。
Gartner預(yù)計(jì),在GenAI創(chuàng)新中,有兩種技術(shù)被認(rèn)為具有最大的潛力——特定領(lǐng)域的GenAI模型和自主代理。
Gartner杰出副總裁分析師Arun Chandrasekaran表示:“由于技術(shù)和供應(yīng)商的生態(tài)系統(tǒng)混亂且快速發(fā)展,企業(yè)將繼續(xù)難以駕馭GenAI生態(tài)系統(tǒng)。“隨著行業(yè)整合的開始,GenAI正處于幻滅的低谷。一旦炒作平息,真正的好處就會(huì)顯現(xiàn)出來,未來幾年能力的進(jìn)步可能會(huì)很快。”
多模態(tài)GenAI將對(duì)企業(yè)應(yīng)用程序產(chǎn)生變革性的影響,因?yàn)樗梢蕴砑有碌奶匦院凸δ?。其影響并不局限于特定的行業(yè)或用例,可以應(yīng)用于人工智能與人類之間的任何接觸點(diǎn)。今天,許多多模態(tài)模型僅限于兩種或三種模態(tài),在未來幾年內(nèi)將增加,能夠包括更多模態(tài)。
Brethenoux說:“在現(xiàn)實(shí)世界中,人們通過聲音、視覺和感知等不同方式的組合來接觸和理解信息。”“多模態(tài)GenAI很重要,因?yàn)閿?shù)據(jù)通常是多模態(tài)的。當(dāng)單一模態(tài)模型被組合或整合以支持多模態(tài)GenAI應(yīng)用程序時(shí),通常會(huì)導(dǎo)致延遲和不準(zhǔn)確的結(jié)果,從而導(dǎo)致較低質(zhì)量的體驗(yàn)。”
其他熱門趨勢(shì)還包括:
開源LLM
開源LLM是深度學(xué)習(xí)基礎(chǔ)模型,通過實(shí)現(xiàn)商業(yè)訪問的民主化,并允許開發(fā)人員針對(duì)特定任務(wù)和用例優(yōu)化模型,可以加速GenAI實(shí)現(xiàn)的企業(yè)價(jià)值。此外,它們還提供了訪問企業(yè)、學(xué)術(shù)界和其他研究角色中的開發(fā)人員社區(qū)的途徑,這些開發(fā)人員社區(qū)正朝著改進(jìn)模型并使其更有價(jià)值的共同目標(biāo)努力。
Chandrasekaran說:“開源LLM通過定制、更好地控制隱私和安全、模型透明度、利用協(xié)作開發(fā)的能力以及減少供應(yīng)商鎖定的潛力,提高了創(chuàng)新潛力。”“最終,它們?yōu)槠髽I(yè)提供了更小的模型,更容易培訓(xùn),成本更低,并支持業(yè)務(wù)應(yīng)用程序和核心業(yè)務(wù)流程。”
特定領(lǐng)域GenAI模型
特定領(lǐng)域的GenAI模型針對(duì)特定行業(yè)、業(yè)務(wù)功能或任務(wù)的需求進(jìn)行了優(yōu)化。它們可以改進(jìn)企業(yè)內(nèi)的用例一致性,同時(shí)提供改進(jìn)的準(zhǔn)確性、安全性和隱私性,以及更好的上下文化答案。與通用模型相比,這減少了對(duì)高級(jí)提示工程的需求,并且可以通過有針對(duì)性的訓(xùn)練降低幻覺風(fēng)險(xiǎn)。
Chandrasekaran說:“特定領(lǐng)域的模型可以為特定行業(yè)的任務(wù)提供更先進(jìn)的起點(diǎn),從而更快地實(shí)現(xiàn)價(jià)值,提高性能并增強(qiáng)人工智能項(xiàng)目的安全性。”“這將鼓勵(lì)更廣泛地采用GenAI,因?yàn)榻M織將能夠?qū)⑺鼈儜?yīng)用到通用模型性能不夠的用例中。”
自治代理
自主代理是在沒有人為干預(yù)的情況下實(shí)現(xiàn)定義目標(biāo)的組合系統(tǒng)。他們使用各種人工智能技術(shù)來識(shí)別環(huán)境中的模式,做出決策,調(diào)用一系列動(dòng)作并生成輸出。這些智能體有可能從它們的環(huán)境中學(xué)習(xí),并隨著時(shí)間的推移而改進(jìn),使它們能夠處理復(fù)雜的任務(wù)。
Brethenoux說:“自主代理代表了人工智能能力的重大轉(zhuǎn)變。“他們的獨(dú)立運(yùn)營和決策能力使他們能夠改善業(yè)務(wù)運(yùn)營,增強(qiáng)客戶體驗(yàn)并實(shí)現(xiàn)新產(chǎn)品和服務(wù)。這可能會(huì)節(jié)省成本,賦予競(jìng)爭(zhēng)優(yōu)勢(shì)。它還帶來了組織勞動(dòng)力從交付到監(jiān)督的轉(zhuǎn)變。”