ChatGPT爆火,國內算力廠商如何把握機會?

ChatGPT的爆火給生成式AI的應用帶來更多可能性,AI語言處理大模型也隨之進入全球角逐的新階段。在國內,百度、阿里等頭部互聯網企業(yè)都已經宣布有相關的研究。

本文來自微信公眾號“電子發(fā)燒友網”,作者/李彎彎。

近段時間,由OpenAI推出的ChatGPT火遍全球,它幾乎可以生成任何形式的文本,從寫文章、編寫代碼,到回答復雜的數學問題。上線近兩個月,ChatGPT的注冊用戶就達到1億,成為史上用戶破億速度最快的軟件之一。

ChatGPT的爆火給生成式AI的應用帶來更多可能性,AI語言處理大模型也隨之進入全球角逐的新階段。在國內,百度、阿里等頭部互聯網企業(yè)都已經宣布有相關的研究。那么,國內在發(fā)展AI語言處理大模型方面是否具備相應的條件,國產廠商可以如何把握這個機會?

在AIGC大模型發(fā)展上,國內具備哪些條件

從目前的情況來看,國內在發(fā)展這類大模型上可以說已經具備一定的條件。比如在算法層面,國內的互聯網公司以及一些研究院,已經具備研究語言大模型的基礎;在算力層面,國內的AI大算力芯片,以及在算力集群方面,也已經取得長足進步;在部署和服務方面,國內的云服務廠商可以提供各種服務渠道,讓基礎設施能夠便捷實用,使算法在大算力平臺上很好的部署。

不足之處在于,第一,ChatGPT能夠達到現在的水平,是因為它六七年長時間的產品迭代,從GPT-1到GPT-2再到ChatGPT期間有大量的用戶使用,在數據集的標注、分揀、精煉上,也有很多創(chuàng)新的工程化步驟。對于中文大模型來說,差距在于如何獲得更多、更有意義,更有價值的語義語料,如何在算法迭代、大量的用戶使用之后,使能更大規(guī)模模型的推進。

第二,大模型的訓練離不開大算力,燧原科技創(chuàng)始人兼COO張亞林在接受電子發(fā)燒友采訪的時候表示,目前國際廠商的高算力芯片在中國仍然具有標桿效應。

第三,在生態(tài)建設上,無論是現在很火的ChatGPT,還是之前備受關注的生成式AI公司Stability、Runway,他們在基礎模型、大模型的模型開發(fā)庫,用戶大量的應用上,都已經形成了可以觸達終端用戶的商業(yè)模式。而在國內,目前還沒樹立起這樣全棧的生態(tài)和商業(yè)模式。

不過,雖然國內在發(fā)展這類大模型方面存在不足,整體而言這對于國內廠商來是個很好的機會。從算力方面來看,人工智能技術的發(fā)展和應用本身對算力的需求極大,目前全球大模型訓練的算力基本以英偉達為主。

隨著ChatGPT的爆火,國內各類生成式AI大模型的訓練和部署將會加速,這對國內人工智能算力廠商來說無疑是個機會,國內廠商需要思考如何通過自身的算力發(fā)展,來持續(xù)推動中國本土大模型的進步。

ChatGPT爆火,算力廠商如何把握機會

那么AIGC大模型的訓練和推理,對算力供應商有怎樣的要求呢?對此,張亞林談到了幾點:首先是芯片,包括芯片的有效算力、架構的創(chuàng)新性、以及芯片的性價比等,這些將會決定算力集群是否具備足夠的市場競爭力。

其次是集群系統(tǒng),一個超大規(guī)模的集群系統(tǒng),由幾千張加速卡、幾千顆芯片組成,還包括互聯和存儲。除了加速卡的性能之外,還要看整個系統(tǒng)的穩(wěn)定性、集群的互聯效率、存儲的效率、以及分布式系統(tǒng)運行的穩(wěn)定性。

第三是軟件生態(tài),它是否能夠支持整個大模型的調試和開發(fā)。這要求企業(yè)不僅要能提供基礎的軟件棧,還要能夠提供大模型能跑的分布式框架,讓調試者和開發(fā)者能夠更好的調試和開發(fā)這些大模型,就是說還需要具備一個整套的軟件棧。

張亞林認為,從芯片設計,集群的穩(wěn)定性,到整個軟件棧的完備性,這對于初創(chuàng)公司來說還有一段很長的路要走,需要持續(xù)的產品迭代。

那么國內在AI大算力芯片或者GPGPU賽道的廠商,如何能夠抓住ChatGPT這波浪潮帶來的機會呢?首先,它需要做出高性價比的算力,現在來說這樣的算力還太貴,以致于并不是所有人都能夠玩得起這場游戲,企業(yè)需要能夠推出高性價比的集群,讓整個ChatGPT類大模型的開發(fā)更經濟。

第二,最終呈現在用戶側的是整個的集群系統(tǒng),就如上文所言,其中包括幾千張加速卡,幾千顆芯片,大量的互聯和存儲,很多服務器。因此,國內的AI大芯片廠商需要能夠站到系統(tǒng)的角度去看問題,包括整個系統(tǒng)的設計、調動能力、讓用戶易用,這些跟芯片本身的設計和開發(fā)能力會不太一樣。

第三,如何讓用戶在開發(fā)過程中做到高效和易用。訓練本身是一個很復雜、很廣闊的生態(tài)。今天的大模型,其實是把很廣闊的需求濃縮到了一些比較確定的大模型上,這讓整個訓練從很廣闊的發(fā)散狀態(tài),變成了有可能聚焦在某一些維度上就能夠很好的支撐和優(yōu)化的狀態(tài)。

這給國內很多AI廠商提供了很好的思路,企業(yè)可以聚焦在比如大模型集群化的領域。國內廠商可以由此切入,誰能夠在這樣一個大規(guī)模AI生成領域,把訓練和推理整套集群系統(tǒng),做得更優(yōu)化、更完整、更易用,誰就能夠在這場游戲中拔得先機。

在人工智能算力領域,燧原科技已經有了很深的積累。目前燧原科技已經迭代了兩代訓練和推理產品,第三代也已經在研發(fā)中。此外,燧原科技已經在科研領域和智慧城市的應用中落地了訓練和推理的超千卡算力集群。張亞林表示,類似ChatGPT這樣的AIGC生成式模型,對于燧原科技而言是個機遇,公司可以把已經積累的系統(tǒng)集群的經驗推廣到更多的客戶賽道上,幫助客戶使能更多大模型的生成。

同時,面對生成式AI大模型帶來的發(fā)展機會,燧原科技將從多個方面去做深度布局。第一是持續(xù)推進和迭代集群化產品和軟件生態(tài)棧,與更多戰(zhàn)略用戶一起優(yōu)化集群系統(tǒng),提高性價比和能效比;第二是與國內云服務商進行深度合作,通過他們的云服務平臺,觸達更多To B和To C用戶;第三是與國家相關機構合作制定更多關于AIGC標準和白皮書,探討未來發(fā)展方向,與國家政策和標準融合;第四是與更多大模型廠商、云平臺廠商等一起共創(chuàng)生態(tài)。

小結

整體而言,雖然目前ChatGPT仍然還存在一些問題,不過它的強大功能卻是有目共睹。對于人們的生產生活來說,ChatGPT等大模型的發(fā)展將會帶來勞動力的釋放。

未來隨著模型的進一步擴大,數據集進一步加強,AIGC這類巨大模型將會愈發(fā)智能,它也將會更加逼近人們所說的通用人工智能(AGI),而這個過程必然給相關產業(yè)帶來機會,包括算力,而對于用戶來說,廠商如何提供更高能效比、性價比的算力是關鍵。

THEEND

最新評論(評論僅代表用戶觀點)

更多
暫無評論