2023百度十大科技前沿發(fā)明

百度
近日,百度發(fā)布了“2023百度十大科技前沿發(fā)明”,包括“基于大模型的檢索生成決策交互一體的智能系統(tǒng)”“基于大模型的端到端搜索技術(shù)”“飛槳端到端自適應(yīng)的分布式訓(xùn)練技術(shù)”等十項(xiàng)百度前沿發(fā)明。其中超過(guò)70%涉及大模型和重構(gòu)創(chuàng)新,一批創(chuàng)新AI原生應(yīng)用踴躍而來(lái)。

本文來(lái)自百度。

近日,百度發(fā)布了“2023百度十大科技前沿發(fā)明”,包括“基于大模型的檢索生成決策交互一體的智能系統(tǒng)”“基于大模型的端到端搜索技術(shù)”“飛槳端到端自適應(yīng)的分布式訓(xùn)練技術(shù)”等十項(xiàng)百度前沿發(fā)明。其中超過(guò)70%涉及大模型和重構(gòu)創(chuàng)新,一批創(chuàng)新AI原生應(yīng)用踴躍而來(lái)。

“我們大模型的專利申請(qǐng)量、授權(quán)量都是國(guó)內(nèi)第一,深度學(xué)習(xí)專利申請(qǐng)量全球第一。”百度首席技術(shù)官王海峰表示,百度發(fā)布十大科技前沿發(fā)明,是百度一年來(lái)前沿創(chuàng)新成果的集中展現(xiàn)。我們鼓勵(lì)培養(yǎng)AI原生思維,踴躍創(chuàng)新AI原生應(yīng)用。

PART1

具有預(yù)見(jiàn)性的十大發(fā)明

2022年9月,百度首次發(fā)布“十大科技前沿發(fā)明”,披露人工智能及其自動(dòng)駕駛等多個(gè)領(lǐng)域高價(jià)值專利成果。其中就包括“跨模態(tài)通用可控AIGC”“知識(shí)增強(qiáng)大模型”“數(shù)字人智能化生產(chǎn)”等突破性成果。兩個(gè)月后,ChatGPT橫空出世,生成式人工智能和大模型代表了一個(gè)新技術(shù)范式,與百度發(fā)明成果相互印證,證明了“十大科技前沿發(fā)明”的前瞻性和準(zhǔn)確性。

此次,“2023百度十大科技前沿發(fā)明”涉及大模型、基于大模型的端到端搜索、飛槳、AI芯片、生成式檢索、內(nèi)容生成推薦技術(shù)、自動(dòng)駕駛決策系統(tǒng)、生物計(jì)算大模型、高性能量子芯片。充分展示了百度在推動(dòng)前沿創(chuàng)新、促進(jìn)產(chǎn)業(yè)升級(jí)方面的強(qiáng)大實(shí)力,以及百度技術(shù)的前沿性和市場(chǎng)前瞻性。

PART2

聚焦前沿創(chuàng)新必將大有作為

當(dāng)前,數(shù)字經(jīng)濟(jì)與實(shí)體產(chǎn)業(yè)加速融合發(fā)展,我國(guó)的產(chǎn)業(yè)體系品類齊全、體量龐大,人工智能技術(shù)有豐富的應(yīng)用場(chǎng)景,賦能產(chǎn)業(yè)的轉(zhuǎn)型升級(jí),廣泛應(yīng)用于各行各業(yè),成為科技革命和產(chǎn)業(yè)變革的重要驅(qū)動(dòng)力量。北京市知識(shí)產(chǎn)權(quán)局副局長(zhǎng)秦元明提到,我國(guó)在建設(shè)世界科技強(qiáng)國(guó)的新征程中,百度這樣的科技企業(yè)必將大有所為。十大科技前沿發(fā)明展示了百度在多項(xiàng)世界前沿領(lǐng)域的創(chuàng)新和突破,必將引領(lǐng)產(chǎn)業(yè)的高水平創(chuàng)新和高質(zhì)量發(fā)展。

百度集團(tuán)資深副總裁、總法律顧問(wèn)梁志祥表示,技術(shù)競(jìng)爭(zhēng)的背后是知識(shí)產(chǎn)權(quán)的競(jìng)爭(zhēng)。強(qiáng)大公司背后凝聚著一個(gè)強(qiáng)大技術(shù)團(tuán)隊(duì),強(qiáng)大技術(shù)團(tuán)隊(duì)背后凝聚著很多強(qiáng)大的專利。百度擁有充滿技術(shù)基因的強(qiáng)大技術(shù)團(tuán)隊(duì)和知識(shí)產(chǎn)權(quán)團(tuán)隊(duì),大模型技術(shù)和專利布局業(yè)界領(lǐng)先,為百度產(chǎn)品的領(lǐng)先提供了重要支撐。“這個(gè)世界在改變,這個(gè)世界在不斷革新,現(xiàn)在就是各類技術(shù)人員的時(shí)刻。”梁志祥感慨道。

PART3

從拼參數(shù)到拼落地

隨著越來(lái)越多的大模型產(chǎn)品陸續(xù)上線,我國(guó)生成式人工智能發(fā)展也將從“拼大模型參數(shù)”階段步入“拼原生應(yīng)用、拼產(chǎn)業(yè)落地”階段,而產(chǎn)品和應(yīng)用的每一項(xiàng)功能正常運(yùn)轉(zhuǎn),都離不開(kāi)大量的前沿發(fā)明作為底層技術(shù)支撐。這些前沿發(fā)明聚沙成塔,構(gòu)筑起通用人工智能的四大核心能力:理解、生成、邏輯和記憶,驅(qū)動(dòng)大模型各項(xiàng)能力在千行百業(yè)的落地應(yīng)用。

8月31日,文心一言率先向全社會(huì)全面開(kāi)放,獲市場(chǎng)熱烈反響,開(kāi)放首日即回答網(wǎng)友3342萬(wàn)個(gè)問(wèn)題。10月17日,以“生成未來(lái)(PROMPT THE WORLD)”為主題的Baidu World 2023將在北京舉辦。作為年度最重要的戰(zhàn)略、技術(shù)、產(chǎn)品發(fā)布會(huì),百度將發(fā)布多款A(yù)I原生應(yīng)用,介紹大模型核心能力和最新進(jìn)展。百度也將通過(guò)持續(xù)研發(fā)投入和技術(shù)創(chuàng)新,推動(dòng)數(shù)智產(chǎn)業(yè)的快速發(fā)展,與合作伙伴一起推動(dòng)人工智能產(chǎn)業(yè)化落地,實(shí)現(xiàn)高水平科技自立自強(qiáng),為經(jīng)濟(jì)高質(zhì)量增長(zhǎng)帶來(lái)更多動(dòng)能。

附:百度2023十大科技前沿發(fā)明

01

基于大模型的檢索生成決策交互一體的智能系統(tǒng)

該發(fā)明提出了知識(shí)增強(qiáng)的大模型智能交互系統(tǒng)。該發(fā)明通過(guò)知識(shí)內(nèi)化和知識(shí)外用兩種手段增強(qiáng)模型的知識(shí)性和推理能力,通過(guò)檢索增強(qiáng)提升模型實(shí)效性和事實(shí)準(zhǔn)確性,通過(guò)對(duì)話增強(qiáng)提升模型記憶能力和多輪交互能力。該發(fā)明技術(shù)顯著提升了大模型的理解、生成、邏輯、記憶能力,并廣泛應(yīng)用在百度的核心業(yè)務(wù),賦能了千行百業(yè)。

02

基于大模型的端到端搜索技術(shù)

該發(fā)明提出了大模型端到端搜索技術(shù),打破了傳統(tǒng)級(jí)聯(lián)分治的模式,標(biāo)志著10余年來(lái)百度搜索技術(shù)架構(gòu)的重大代際變革。該發(fā)明技術(shù)已被廣泛運(yùn)用于通用搜索、視頻搜索、企業(yè)搜索等多場(chǎng)景,系統(tǒng)效果和研發(fā)效率均顯著提升。

03

飛槳端到端自適應(yīng)的分布式訓(xùn)練技術(shù)

該發(fā)明通過(guò)“兩個(gè)統(tǒng)一表示”對(duì)硬件資源和模型結(jié)構(gòu)統(tǒng)一建模,支持任意模型在異構(gòu)硬件下實(shí)現(xiàn)最優(yōu)模型切分和資源分配,以通用自動(dòng)混合并行策略實(shí)現(xiàn)高效訓(xùn)練,并可針對(duì)故障中斷、資源擴(kuò)縮自適應(yīng)重新完成最優(yōu)切分和并行策略選擇,實(shí)現(xiàn)自動(dòng)容錯(cuò)和彈性調(diào)度,在大規(guī)模分布式訓(xùn)練的靈活性、易用性、高效性和魯棒性等方面具備明顯優(yōu)勢(shì)。該發(fā)明技術(shù)成功助力文心一言高效訓(xùn)練,大規(guī)模集群作業(yè)訓(xùn)練有效率提升超30%,在百度智能云、智能搜索和推薦等核心產(chǎn)品線發(fā)揮重要作用,同時(shí)也廣泛應(yīng)用于傳統(tǒng)行業(yè)的智能化改造,產(chǎn)生了顯著的經(jīng)濟(jì)效益和社會(huì)效益。

04

飛槳多硬件分層適配一體化技術(shù)

針對(duì)智能芯片多樣性,通過(guò)松耦合的分層設(shè)計(jì)和簡(jiǎn)捷適配接口,顯著降低芯片與框架適配復(fù)雜度,廣泛兼容多種硬件類型。針對(duì)AI應(yīng)用的高性能需求,支持軟硬系統(tǒng)極致優(yōu)化,充分發(fā)揮硬件潛能,實(shí)現(xiàn)業(yè)務(wù)應(yīng)用收益最大化。基于該發(fā)明技術(shù),飛槳已經(jīng)和40多家芯片/IP廠商完成高效適配,實(shí)現(xiàn)繁榮的AI軟硬件生態(tài),構(gòu)建AI軟硬件適配技術(shù)體系并推進(jìn)國(guó)家標(biāo)準(zhǔn),引領(lǐng)行業(yè)發(fā)展。

05

面向企業(yè)級(jí)大模型平臺(tái)的AI芯片優(yōu)化技術(shù)

該發(fā)明提出了面向企業(yè)級(jí)大模型平臺(tái)的AI芯片優(yōu)化技術(shù),通過(guò)精準(zhǔn)控制、提前預(yù)判等方式在滿足高性能、低延遲AI計(jì)算的同時(shí)減緩AI芯片的瞬時(shí)大電流。該技術(shù)可以有效減少系統(tǒng)的整體成本、提升系統(tǒng)的穩(wěn)定性和可靠性,并且提升在各種場(chǎng)景下AI處理器的使用效率。該發(fā)明技術(shù)為百度智能云千帆等企業(yè)級(jí)大模型平臺(tái)提供了更加高效、穩(wěn)定的訓(xùn)練和推理能力支持。目前千帆大模型已納管的國(guó)內(nèi)外主流大模型數(shù)量達(dá)到42個(gè),并提供大模型開(kāi)發(fā)和應(yīng)用的整套工具鏈,能為企業(yè)進(jìn)行高效、可靠的AI應(yīng)用的構(gòu)建。

06

全鏈路生成式智能檢索系統(tǒng)

該發(fā)明實(shí)現(xiàn)了工業(yè)界首次將搜索系統(tǒng)與大規(guī)模生成技術(shù)相融合。通過(guò)引入全鏈路的可信度提升策略、真實(shí)數(shù)據(jù)的增強(qiáng)訓(xùn)練和嚴(yán)格的模型風(fēng)控機(jī)制,采用AI原生架構(gòu)設(shè)計(jì),完成異步模型計(jì)算架構(gòu)的深度優(yōu)化,成功地突破了大模型在大規(guī)模用戶應(yīng)用場(chǎng)景的各種挑戰(zhàn)。該發(fā)明技術(shù)全線落地百度搜索產(chǎn)品,進(jìn)一步提升了搜索結(jié)果的準(zhǔn)確性和可靠性,助力搜索首位極致滿足效果快速提升,并超越了國(guó)際同行。

07

基于用戶心智理解的內(nèi)容生成式推薦技術(shù)

該發(fā)明全新構(gòu)建對(duì)話式推薦系統(tǒng),利用大模型理解能力和生成能力的優(yōu)勢(shì):(1)將隱式反饋?zhàn)優(yōu)樽匀徽Z(yǔ)言交互,推薦系統(tǒng)可對(duì)話,更加方便用戶理解;(2)實(shí)現(xiàn)內(nèi)容推薦與內(nèi)容生成結(jié)合,集成推薦前看點(diǎn)、推薦中互動(dòng)、推薦后延伸,提升用戶陪伴式消費(fèi)體驗(yàn);(3)基于大模型能力生成的海量高質(zhì)量資源,支持個(gè)性化生成千人千面的內(nèi)容。該發(fā)明技術(shù)已經(jīng)在百度Feed在線應(yīng)用,以對(duì)話的方式觸達(dá)用戶深層需求,激發(fā)用戶的閱讀興趣和探索效率,一期上線提升用戶時(shí)長(zhǎng)10%。

08

數(shù)據(jù)驅(qū)動(dòng)的自動(dòng)駕駛決策系統(tǒng)

該發(fā)明以深度學(xué)習(xí)技術(shù)為核心,推動(dòng)自動(dòng)駕駛決策系統(tǒng)由規(guī)則驅(qū)動(dòng)向數(shù)據(jù)驅(qū)動(dòng)轉(zhuǎn)型,包括交互決策模型及其訓(xùn)練方法、基于人類駕駛員和自動(dòng)駕駛的數(shù)據(jù)生產(chǎn)方法,以及基于閉環(huán)仿真的評(píng)測(cè)系統(tǒng)等部分。該發(fā)明技術(shù)已在蘿卜快跑Robotaxi業(yè)務(wù)規(guī)?;涞貞?yīng)用,累計(jì)吸收上億幀道路交互場(chǎng)景數(shù)據(jù),決策準(zhǔn)確率達(dá)到99.5%,實(shí)現(xiàn)90%以上的線上規(guī)則替代,有效支持Robotaxi無(wú)人化運(yùn)營(yíng)。

09

融合第一性原理的生物計(jì)算大模型

該發(fā)明融合生物領(lǐng)域數(shù)據(jù)和生物化學(xué)原理,構(gòu)建極具創(chuàng)新性的生物計(jì)算大模型,在化合物和蛋白質(zhì)領(lǐng)域取得重大技術(shù)突破,標(biāo)志著百度在生物計(jì)算方向上的國(guó)際領(lǐng)先性。該發(fā)明技術(shù)已廣泛應(yīng)用在小分子藥物發(fā)現(xiàn)、多肽藥物設(shè)計(jì)、抗體藥物設(shè)計(jì)等場(chǎng)景,在精度和速度上超越眾多傳統(tǒng)方法,助力合作伙伴在多個(gè)管線上找到高價(jià)值候選藥物分子。

10

高性能量子芯片的設(shè)計(jì)、流片與測(cè)控全棧技術(shù)

該發(fā)明瞄準(zhǔn)超導(dǎo)量子芯片研發(fā)“設(shè)計(jì)、流片、測(cè)控”閉環(huán)中的核心技術(shù),旨在研發(fā)具有業(yè)界核心競(jìng)爭(zhēng)力的高性能量子芯片,為量子計(jì)算的實(shí)際應(yīng)用提供基礎(chǔ)支撐。通過(guò)“端到端”的優(yōu)化,以及與量子軟件和量子應(yīng)用的融合,高性能量子芯片研發(fā)將對(duì)人工智能、材料科學(xué)、藥物研發(fā)、金融科技等領(lǐng)域帶來(lái)高潛價(jià)值,進(jìn)而促進(jìn)量子計(jì)算的產(chǎn)業(yè)化。

THEEND

最新評(píng)論(評(píng)論僅代表用戶觀點(diǎn))

更多
暫無(wú)評(píng)論