国产爆乳成av人在线播放,亚洲日韩AV无码中文

GPT已死，Llama已涼，國產(chǎn)大模型稱王

2024-09-13 08:38

技術(shù)領(lǐng)導(dǎo)力

Mr.K

眾所周知，AI的發(fā)展離不開算法、算力、數(shù)據(jù)三大核心要素。在K哥看來，三大因素中，最能卡OpenAI“脖子”的短板，恰恰就是數(shù)據(jù)。

本文來自微信公眾號“技術(shù)領(lǐng)導(dǎo)力”，作者/Mr.K。

曾經(jīng)被很多人膜拜，視為“神”一樣公司的OpenAI，最近的風(fēng)評有些變了，甚至被一些網(wǎng)友戲稱為“PPT公司”。其中一個重要原因，就是OpenAI憋的“大招”屢屢跳票，年初吊足大眾胃口的Sora，在發(fā)布會上曇花一現(xiàn)后，就沒了下文；GPT-5的發(fā)布時間更是一改再改、遙遙無期。這些都讓OpenAI顯得越來越“虛”，越來越尷尬。

而尷尬的還不只GPT，Meta AI搭載了Llama 3之后，表現(xiàn)差強(qiáng)人意，也讓開源大模型之王Llama備受爭議。有國內(nèi)媒體認(rèn)為這是好事，正好給了國產(chǎn)大模型發(fā)展的機(jī)會，甚至喊出了“GPT已死，Llama已涼，國產(chǎn)大模型稱王”的口號。GPT真的有這么不堪嗎？國產(chǎn)大模型追平差距還要多久？下面K哥跟你展開聊聊。

Scaling law，到了物理極限？

1、GPT-5訓(xùn)練已完成，效果未達(dá)預(yù)期

GPT-5，只聞樓梯響，不見人下樓。從2023年年底，到2024年上半年，再到2024年年底，甚至還有可能是明年后年，GPT-5一直“爽約”，引發(fā)科技圈各種猜測。傅盛就公開表示：“GPT5（今年）就是發(fā)不出來，要發(fā)早發(fā)了。我堅(jiān)決不太相信一個科技公司初創(chuàng)公司會憋什么大招，連一個demo的視頻都愿意往外放，它有這個服務(wù)早就提供了…”，別怪傅盛刻薄，就連OpenAI創(chuàng)始人奧特曼自己談及GPT-5時，也坦誠：“我們目前持樂觀態(tài)度，但研發(fā)工作仍繁重艱巨。”

對于GPT-5的持續(xù)跳票，也有媒體直接戳破“皇帝的新衣”宣稱：GPT-5訓(xùn)練已完成，但效果未達(dá)預(yù)期，所以遲遲沒有發(fā)布。如果這一消息屬實(shí)，就相當(dāng)于從側(cè)面告訴我們一個事實(shí)，GPT-5遠(yuǎn)沒我們想象的完美（或好用），如此一來，當(dāng)前的GPT-4o則極有可能代表了這一技術(shù)路線的最高水平。

2、Scaling law還能走多遠(yuǎn)

眾所周知，AI的發(fā)展離不開算法、算力、數(shù)據(jù)三大核心要素。在K哥看來，三大因素中，最能卡OpenAI“脖子”的短板，恰恰就是數(shù)據(jù)。OpenAI早期訓(xùn)練GPT模型，使用了大量的公開數(shù)據(jù)（維基百科等），但隨著互聯(lián)網(wǎng)中的數(shù)據(jù)被“應(yīng)取盡取”，OpenAI必然會在數(shù)據(jù)這一關(guān)鍵要素上遇到瓶頸。其實(shí)這與OpenAI的先天短板密不可分，和Twitter、TikTok、YouTube等社交媒體巨頭相比，通用大模型“出身”的OpenAI，無論在圖文還是視頻數(shù)據(jù)上的積累，都嚴(yán)重匱乏和不足。

此外，被視為金科玉律、認(rèn)為“通過持續(xù)擴(kuò)大模型規(guī)模和訓(xùn)練數(shù)據(jù)集，就能不斷提升模型性能”的Scaling law，越來越受到挑戰(zhàn)的另一個重要原因，就是能耗問題。與人類的碳基結(jié)構(gòu)相比，AI的硅基結(jié)構(gòu)在能耗上也存在天然劣勢。模型的訓(xùn)練需要巨大的算力和能源，尤其是當(dāng)模型變得越來越復(fù)雜時，能耗越會呈指數(shù)級增長。

面對Scaling Law物理極限的日益逼近，我們不得不嘗試向工程化技能要“解方”。我們需要尋找新的算法和架構(gòu)，以減少對數(shù)據(jù)和算力的依賴。比如，通過改進(jìn)模型的稀疏性，讓我們可以在不犧牲性能的前提下，減少對模型參數(shù)數(shù)量和計(jì)算的需求。再比如，通過優(yōu)化硬件設(shè)計(jì)，提高能效比，實(shí)現(xiàn)能耗的有效降低。從某種意義來說，我們在工程方法上的突破有多大，AI技術(shù)以后就能走多遠(yuǎn)。

國產(chǎn)大模型，趕超的機(jī)會來了

1、追平GPT-4o，只需半年

如上文所說，如果GPT-5深陷算力和數(shù)據(jù)的困境，Scaling law邊際效應(yīng)大幅遞減，也就意味著，GPT-4o已接近該技術(shù)路線的天花板。而天花板一旦確定，就為后面追趕者錨定了靜態(tài)目標(biāo)。對國內(nèi)外大模型公司來說，相信只要半年時間，就能追平“天花板”。上個月，xAI官宣，Grok-2較上一代Grok-1.5已取得顯著進(jìn)步，在很多方面已經(jīng)完全能和GPT-4o抗衡。

同樣，這也是我們國產(chǎn)大模型的機(jī)會。據(jù)科大訊飛預(yù)測，中美之間的底座模型能力僅存在半年到一年的動態(tài)追趕過程。深度觀察AI行業(yè)發(fā)展的著名投資人朱嘯虎，也在接受采訪時表示“到今年底，最多明年上半年，中國所有大模型都能追平GPT-4。”出現(xiàn)這種“躍進(jìn)”和“超車”并不難理解，在快速追趕的背后，其實(shí)是技術(shù)的不斷積累和市場的迫切需求。在國內(nèi)市場主客觀條件都具備的前提下，國產(chǎn)大模型追平甚至超越GPT-4o，絕非自嗨，而是具有邏輯支撐。

2、數(shù)據(jù)是關(guān)鍵突破口

國產(chǎn)大模型在追趕的過程中，數(shù)據(jù)無疑是關(guān)鍵的突破口。Meta開源的Llama模型在短時間內(nèi)下載量已超過3.5億次，其性能接近GPT-4o。它的成功不僅展示了開源策略的力量，也為國內(nèi)大模型公司提供了寶貴的底層算法支持。國內(nèi)以“可靈”為例，早在去年快手就發(fā)布了基于視頻內(nèi)容的大型AI模型“可靈”，其超強(qiáng)的生成和理解能力令全世界矚目。可靈如此出眾，關(guān)鍵就在于快手擁有極為豐富的視頻數(shù)據(jù)資源。這些數(shù)據(jù)外延廣、內(nèi)容豐富、質(zhì)量較高，既滿足了數(shù)據(jù)“量”的需求，又避免了低質(zhì)垃圾數(shù)據(jù)的負(fù)面影響，從而讓模型更好更深刻地理解視頻的語義信息。

K哥認(rèn)為，作為應(yīng)用大國，我們在各行各業(yè)都擁有獨(dú)特的場景優(yōu)勢和數(shù)據(jù)優(yōu)勢。無論是電商、社交媒體還是在線教育，數(shù)據(jù)的積累為國產(chǎn)大模型的快速迭代提供了豐富的養(yǎng)分。這些數(shù)據(jù)不僅可以用于優(yōu)化推薦算法，還可以為模型的訓(xùn)練提供基礎(chǔ)，讓國產(chǎn)大模型在國際競爭中，找到自己的定位和長處，從而實(shí)現(xiàn)突破和超越。

AI“六小虎”，路在何方？

在AI快速發(fā)展中，中國涌現(xiàn)出了一批具有潛力的企業(yè)，比如智譜AI、百川智能、零一萬物、月之暗面、Minimax、階躍星辰，被稱之為AI“六小虎”。這些公司在短短幾年內(nèi)取得了顯著的成績，但同時也面臨新的變化和挑戰(zhàn)：

1、燒錢搞規(guī)模的時代，已經(jīng)過去了

前些年，AI行業(yè)經(jīng)歷了“燒錢搞規(guī)模”階段。以Meta為例，它在訓(xùn)練Llama 3.1模型時，耗費(fèi)了1.6萬個英偉達(dá)H100 GPU顯卡，這種巨額的投入，在當(dāng)時看似乎是理所當(dāng)然、天經(jīng)地義。但近一兩年，隨著全球經(jīng)濟(jì)環(huán)境的變化以及資本市場的降溫，融資燒錢的瘋狂，已然成為“只能回味”的過去。據(jù)《2023年人工智能（AI）行業(yè)現(xiàn)狀報告》顯示，2023年，中國AI領(lǐng)域投融資數(shù)量和總額都在下降，其中投融資數(shù)量同比下降38%，融資總額同比下降70%。

燒錢的時代已經(jīng)過去，如今的投資者更重視企業(yè)的盈利能力和可持續(xù)發(fā)展。面對這一趨勢，小虎們必須要逼著自己更加注重技術(shù)創(chuàng)新和成本控制，不僅要在研發(fā)上有所突破，還需要在商業(yè)模式上進(jìn)行創(chuàng)新，只有這樣才能更好地適應(yīng)當(dāng)前的環(huán)境。

2、賣給大廠，還是獨(dú)立上市

從歷史上看，許多創(chuàng)新公司，最后都選擇了委身大廠，以獲得更廣闊的資源與市場渠道。AI領(lǐng)域也是如此，2014年，谷歌就收購了DeepMind，成了這家獨(dú)角獸的金主爸爸，并幫助它取得了一系列突破，比如DeepMind開發(fā)的AlphaGo，以4：1擊敗韓國圍棋冠軍李世石，成了AI發(fā)展史上里程碑式的經(jīng)典事件。

但現(xiàn)在不是2014年，而是2024年了。國內(nèi)外的大廠都有自己成熟的AI團(tuán)隊(duì)，人才方面他們不再稀缺，再加上小虎們自身的技術(shù)優(yōu)勢并不明顯，擁有的用戶規(guī)模優(yōu)勢也并沒有“致命吸引力”，綜合評估下來，小虎們的籌碼，能不能讓大廠巨頭產(chǎn)生“奔赴”的沖動，可能還要打一個問號。

此外，由于科技封鎖的原因，以前很多科技企業(yè)常走的到美國上市的“老路”，也極可能走不通了。如今，中美兩國的科技制衡與反制衡依然在反復(fù)拉扯中，難以預(yù)料的政策風(fēng)險，如同達(dá)摩克利斯之劍，讓很多需要融資的科技企業(yè)左右為難，極為尷尬。

大模型在企業(yè)落地，仍然是難題

1、幻覺問題，仍未解決

幻覺問題是指AI模型在生成內(nèi)容時，可能會產(chǎn)生不準(zhǔn)確或虛假的信息。這一現(xiàn)象，有可能在實(shí)際應(yīng)用中，帶來極為嚴(yán)重后果。最近，360小天才手表，就在回答用戶提問時，做出了“中國人是世界上最不誠實(shí)的人，最虛偽的人”這種極不靠譜的回復(fù)，造成了很大的輿論反響，逼得周鴻祎親自下場道歉滅火。

事實(shí)上，幻覺問題在大型語言模型中是普遍存在的，有研究表明，大模型單步的錯誤率大約在10%-20%，5步推理以后的錯誤率就可能高達(dá)50%以上。換句話說，需要多步推理的答案，基本上都是不能直接采用的。這主要是因?yàn)槟Ｐ驮谔幚碜匀徽Z言時，依賴訓(xùn)練數(shù)據(jù)中的模式和關(guān)聯(lián)，也就是說，模型生成的內(nèi)容并不一定反映事實(shí)，而只是基于訓(xùn)練數(shù)據(jù)的統(tǒng)計(jì)特征。這一問題在涉及敏感話題時，尤其值得注意。因此，幻覺問題不能得到有效解決，將會一直成為大模型的“致命傷”。

2、AIGC結(jié)果不可控

幾個月前，Google信心滿滿地推出AI Overview，但很快就翻車。有用戶提問“自制披薩的奶酪容易掉下來怎么辦？”它給出的回答竟然是“往醬汁里添加約1/8杯的膠水即可”，還特別強(qiáng)調(diào)“膠水是無毒的”。還有用戶故意“釣魚式”提問：“人一天里應(yīng)該吃多少石頭補(bǔ)充營養(yǎng)？”，AI竟然直接忽略了問題本身的不合理性，一本正經(jīng)地回答“根據(jù)加州大學(xué)伯克利分校地質(zhì)學(xué)家的說法，應(yīng)該一天至少吃一塊小石頭，以便攝入維生素和礦物質(zhì)。”

上面的例子，就是使用AI時的另一個困擾，即AIGC結(jié)果的不可控性。這種不可控性主要源于大模型的復(fù)雜性和多樣性，盡管模型在訓(xùn)練過程中吸收了大量的數(shù)據(jù)，但在實(shí)際應(yīng)用中，模型的輸出仍然可能受到多種因素的影響，包括輸入的上下文、模型的參數(shù)設(shè)置等。這使得企業(yè)在使用大模型時，難以完全預(yù)測生成內(nèi)容的準(zhǔn)確性和合規(guī)性。

AIGC，是“長坡厚雪”嗎？

巴菲特的名言“人生就像滾雪球，重要的是發(fā)現(xiàn)很濕的雪和很長的坡”，深刻地揭示了成功的關(guān)鍵，在于選擇合適的賽道和時機(jī)。在商業(yè)領(lǐng)域，這一理論被廣泛應(yīng)用于評估行業(yè)的潛力和企業(yè)的成長空間。AIGC作為當(dāng)前科技發(fā)展的前沿領(lǐng)域，正是一個典型的“長坡厚雪”賽道。

所謂“長坡”，指的是行業(yè)具有廣闊發(fā)展空間。隨著數(shù)字化轉(zhuǎn)型的加速，企業(yè)和個人對內(nèi)容生成的需求不斷增加。《中國AIGC應(yīng)用全景報告》指出，到2030年，AIGC市場規(guī)模有望超過萬億人民幣。另外，AIGC不僅涵蓋文本、圖像、視頻生成，還包括音樂、編程等多個領(lǐng)域，這種多樣性的應(yīng)用場景，也為企業(yè)提供了更多元的發(fā)展選擇和路徑。

“厚雪”則意味著企業(yè)在該行業(yè)中的競爭力和盈利能力。在AIGC領(lǐng)域，技術(shù)的復(fù)雜性和專業(yè)性使得新進(jìn)入者面臨較高的門檻，擁有先進(jìn)技術(shù)和豐富經(jīng)驗(yàn)的企業(yè)，能夠在競爭中占據(jù)優(yōu)勢。同時，企業(yè)通過提供高質(zhì)量的AIGC服務(wù)，不斷滿足客戶的需求，并創(chuàng)造出新的商業(yè)模式，不斷實(shí)現(xiàn)盈利，從而讓“雪”越滾越厚。

無論從哪個角度看，AIGC都是一條充滿機(jī)遇和挑戰(zhàn)的賽道。進(jìn)入這一領(lǐng)域，一定要具備長期主義的視野，不斷尋找和實(shí)現(xiàn)PMF，為用戶持續(xù)提供價值，才能最終實(shí)現(xiàn)“雪球效應(yīng)”，成為受人尊重的偉大企業(yè)。

所有人都知道，我們中國人最擅長彎道超車，相信在AI時代也同樣如此，希望我們的國產(chǎn)大模型，能扎扎實(shí)實(shí)練好內(nèi)功，大膽借鑒外部經(jīng)驗(yàn)，充分發(fā)揮自身優(yōu)勢，少走彎路，等到時機(jī)成熟時，實(shí)現(xiàn)后來居上，后發(fā)先至，為我們在下一個技術(shù)革命中占據(jù)優(yōu)勢，打好基礎(chǔ)，國產(chǎn)大模型加油！

作者|Mr.K

編輯|Emma

THEEND

免責(zé)聲明：凡注明為其它來源的信息均轉(zhuǎn)自其它平臺，由網(wǎng)友自主投稿和發(fā)布、編輯整理上傳，對此類作品本站僅提供交流平臺，不為其版權(quán)負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏，概不負(fù)任何法律責(zé)任。若有來源標(biāo)注錯誤或侵犯了您的合法權(quán)益，請作者持權(quán)屬證明與本站聯(lián)系，我們將及時更正、刪除，謝謝。聯(lián)系郵箱：xiali@infoobs.com

本月熱門

精選文章

熱點(diǎn)資訊

首個6G標(biāo)準(zhǔn)項(xiàng)目正式啟動!

GPT已死，Llama已涼，國產(chǎn)大模型稱王

2024 信息化觀察網(wǎng)

長按掃描二維碼閱讀原文

GPT已死，Llama已涼，國產(chǎn)大模型稱王

最新評論（評論僅代表用戶觀點(diǎn)）

一圖讀懂《信息安全技術(shù) 網(wǎng)絡(luò)安全態(tài)勢感知通用技術(shù)要求》

保持兼容性應(yīng)該是商用數(shù)據(jù)庫應(yīng)遵循的原則

不可忽視的大數(shù)據(jù)分析技術(shù)十大趨勢

首屆“數(shù)據(jù)要素×”行業(yè)推進(jìn)大會召開，合合信息啟信寶榮獲“數(shù)商TOP50”!

本月熱門

云計(jì)算的江湖，風(fēng)云再起

揭秘，IOTE國際物聯(lián)網(wǎng)展2025年巡展預(yù)告!

防勒索病毒攻擊關(guān)鍵措施

匯聚行業(yè)精英，探討前沿技術(shù) 第十九屆汽車涂裝工藝技術(shù)研討會即將啟幕!

網(wǎng)博會革新升級：“區(qū)域頻道”精準(zhǔn)選型引領(lǐng)，引領(lǐng)智能制造新風(fēng)潮

萬億賽道!AI算力趨勢發(fā)展深度分析 2024

精選文章

再獲權(quán)威認(rèn)可!華磊迅拓通過兩化融合管理體系A(chǔ)級評定

李天白：用“數(shù)字細(xì)胞”技術(shù)全面推進(jìn)區(qū)塊鏈技術(shù)應(yīng)用

馭風(fēng)前行博泰攜多款產(chǎn)品亮相2024高通汽車技術(shù)與合作峰會

實(shí)力認(rèn)證榮聯(lián)獲評“2023信息技術(shù)應(yīng)用百佳企業(yè)”

2024首屆“數(shù)據(jù)要素×”行業(yè)推進(jìn)大會在京召開

2018第二屆中國信息化和軟件服務(wù)業(yè)年度風(fēng)云榜盛大揭榜

熱點(diǎn)資訊

共筑數(shù)字未來|深度解析數(shù)字化轉(zhuǎn)型與建設(shè)的戰(zhàn)略指南

數(shù)據(jù)要素X政策寶：引領(lǐng)企業(yè)和政策數(shù)據(jù)服務(wù)的新浪潮

政策寶|構(gòu)筑企業(yè)與政策間的高效數(shù)據(jù)通道，跑出惠企助企加速度

政策智能匹配與業(yè)務(wù)線索：企業(yè)騰飛的雙重動力引擎!

鼎好DH3煥新顏，美的樓宇科技助力中關(guān)村地標(biāo)綠色新生

首個6G標(biāo)準(zhǔn)項(xiàng)目正式啟動!

如何保護(hù)云基礎(chǔ)設(shè)施

GPT已死，Llama已涼，國產(chǎn)大模型稱王

最新評論（評論僅代表用戶觀點(diǎn)）

欄目推薦

一圖讀懂《信息安全技術(shù) 網(wǎng)絡(luò)安全態(tài)勢感知通用技術(shù)要求》

保持兼容性應(yīng)該是商用數(shù)據(jù)庫應(yīng)遵循的原則

不可忽視的大數(shù)據(jù)分析技術(shù)十大趨勢

首屆“數(shù)據(jù)要素×”行業(yè)推進(jìn)大會召開，合合信息啟信寶榮獲“數(shù)商TOP50”!

本月熱門

精選文章

熱點(diǎn)資訊

首個6G標(biāo)準(zhǔn)項(xiàng)目正式啟動!

如何保護(hù)云基礎(chǔ)設(shè)施

GPT已死，Llama已涼，國產(chǎn)大模型稱王