阿里夸克蔣冠軍:大模型應(yīng)用要解決知識正確性問題

張維佳
在互聯(lián)網(wǎng)高速發(fā)展的30余年中,搜索引擎曾經(jīng)高效地滿足了用戶主動獲取信息的需求。但是隨著移動互聯(lián)網(wǎng)內(nèi)容生產(chǎn)和供給模式的轉(zhuǎn)變,傳統(tǒng)搜索逐步變得封閉化、孤島化。基于大模型的AIGC技術(shù)將會給搜索產(chǎn)品帶來全新變化,推進搜索革新已經(jīng)成為行業(yè)共識。

640 (2).png

本文來自微信公眾號“中國電子報”,作者/張維佳。

“面向未來,要解決大模型的應(yīng)用問題,關(guān)鍵要解決知識正確性問題。”日前,阿里巴巴智能信息事業(yè)群發(fā)布全棧自研、千億級參數(shù)的夸克大模型,夸克技術(shù)負(fù)責(zé)人蔣冠軍在接受《中國電子報》記者采訪時表示,目前圍繞大模型的創(chuàng)新產(chǎn)品,例如生成文案、生成圖像或者問答等,主要依靠大模型的創(chuàng)意能力生成。而要讓大模型發(fā)揮出更大作用,還應(yīng)把創(chuàng)意和知識相結(jié)合。目前,大模型大規(guī)模應(yīng)用的時代還未到來。

“搜索引擎和大模型是天然之配”

在互聯(lián)網(wǎng)高速發(fā)展的30余年中,搜索引擎曾經(jīng)高效地滿足了用戶主動獲取信息的需求。但是隨著移動互聯(lián)網(wǎng)內(nèi)容生產(chǎn)和供給模式的轉(zhuǎn)變,傳統(tǒng)搜索逐步變得封閉化、孤島化?;诖竽P偷腁IGC技術(shù)將會給搜索產(chǎn)品帶來全新變化,推進搜索革新已經(jīng)成為行業(yè)共識。

蔣冠軍介紹,夸克大模型是面向搜索、生產(chǎn)力工具和資產(chǎn)管理助手的應(yīng)用型大模型。在搜索應(yīng)用中,將通過圖文多模理解、專業(yè)知識生成、交互方式創(chuàng)新進一步拓寬應(yīng)用場景,提升用戶體驗。

記者了解到,夸克大模型基于搜索業(yè)務(wù)積累,擁有四大優(yōu)勢。一是全面的通用知識數(shù)據(jù)和行業(yè)知識數(shù)據(jù),以及知識理解和評估體系;二是千億級參數(shù)平臺的模型訓(xùn)練能力;三是擁有長期智能化產(chǎn)品經(jīng)驗的智能技術(shù)產(chǎn)運團隊;四是擁有全行業(yè)的知識增強技術(shù)體系及能力。

“搜索引擎跟大模型是天然之配。”清華大學(xué)新聞學(xué)院教授沈陽指出。搜索引擎中匯聚了用戶的實時查詢需求,為大模型訓(xùn)練提供了海量的數(shù)據(jù)資源。同時,用戶查詢、點擊、返回的過程也是一種交互,大模型可以將搜索到的結(jié)果進行聚合和整合,更好地進行更新迭代。此外,搜索引擎有嚴(yán)格的審核機制,可進一步保障大模型內(nèi)容安全。“5到10年后,人們有任何問題都會習(xí)慣于問大模型,搜索引擎或?qū)⒉粡?fù)存在。”沈陽預(yù)判道。

蔣冠軍認(rèn)為,現(xiàn)階段,大模型技術(shù)仍有待提高,短期內(nèi)將繼續(xù)與搜索引擎并存。但長期來看,以搜索引擎為主大模型為輔的模式將被逐步取代,演變?yōu)橐源竽P蜑楹诵摹⑺阉饕孑o助創(chuàng)新的新形式。

大模型的應(yīng)用是一個循序漸進的過程

談及大模型技術(shù)的應(yīng)用落地,蔣冠軍表示,夸克大模型將應(yīng)用于通用搜索、醫(yī)療健康、教育學(xué)習(xí)、職場辦公等多個場景,從知識能力、對話能力、創(chuàng)作能力和安全能力等四個方面幫助用戶提升效率。

在知識能力方面,夸克大模型擁有廣泛的知識覆蓋、信息搜集和多語言支持等功能,支持外接專業(yè)知識增強,提升跨領(lǐng)域的知識和語言理解能力;在對話能力方面,具備較強的上下文理解、語境推理、關(guān)鍵信息保持和記憶能力,能夠更好地適應(yīng)不斷變化的語境,理解用戶的意圖和需求,確保對話回復(fù)準(zhǔn)確、合理、連貫;在創(chuàng)作能力方面,能夠根據(jù)主題或關(guān)鍵詞,生成連貫、有邏輯、有深度的文本內(nèi)容,支持續(xù)寫、潤色、仿寫、批改等多種不同寫作需求;在安全能力方面,具備較好的世界觀、價值觀,對于明顯的虛假信息,能做到準(zhǔn)確識別、正確回答或者給出合理指引。

沈陽指出,大模型的應(yīng)用是一個循序漸進的過程。不同領(lǐng)域,對準(zhǔn)確性、幻覺率有不同要求,應(yīng)用進程也會存在差異。“大模型將在設(shè)計、網(wǎng)絡(luò)客服這類對準(zhǔn)確性要求不高或者以交互為主的領(lǐng)域率先實現(xiàn)應(yīng)用;而像醫(yī)學(xué)、政務(wù)寫作等對交互質(zhì)量有較高要求的領(lǐng)域,要隨著其準(zhǔn)確率的不斷提升,逐步實現(xiàn)應(yīng)用。”沈陽說。

“未來,大模型技術(shù)將朝著多模態(tài)融合方向發(fā)展,把單一的文本、圖像、聲音數(shù)據(jù)進行合并,通過跨模態(tài)技術(shù)進行輸出。”沈陽期待,將搜索引擎的優(yōu)勢充分內(nèi)化到大模型研發(fā)中,讓我們的國產(chǎn)大模型,走出一條有別于其他國家的發(fā)展新路。

THEEND

最新評論(評論僅代表用戶觀點)

更多
暫無評論