字節(jié)AI為何兇猛:重啟App工廠,爭搶“豆包”,連模型也要賽馬

字節(jié)AI產(chǎn)品今天的突飛猛進,是其賽馬機制下,一套屢試不爽的產(chǎn)品開發(fā)方法論加持的結(jié)果。但與移動互聯(lián)網(wǎng)時代字節(jié)的“生產(chǎn)體系”很不同的是,今天在底層的模型側(cè),字節(jié)也在進行著賽馬。

本文來自微信公眾號“硅星人Pro”,【作者】Yoky。

2023年8月18日,字節(jié)跳動旗下AI對話產(chǎn)品Grace,更名為「豆包」。

在百模大戰(zhàn)一波又一波密集的“重磅發(fā)布”中,這條當時看著毫不起眼的消息,悄然開啟了字節(jié)大模型的多重宇宙。

從時間線來看,字節(jié)跳動的確晚了。相比于當時反應(yīng)迅速的百度和阿里,沒有發(fā)布基礎(chǔ)模型的字節(jié),彼時并無法靠「豆包」來說服質(zhì)疑它的觀眾們。

據(jù)字節(jié)內(nèi)部人士透露,2023年年初,集團內(nèi)部才剛剛開始訓(xùn)練基礎(chǔ)模型,而后,字節(jié)跳動創(chuàng)始人張一鳴明確了“不卷基模,做AI應(yīng)用”的戰(zhàn)略方向,之后字節(jié)開始高舉高打,內(nèi)部的組織架構(gòu)以及外部策略都開始進行了大變革。

11月27日,也就是確認字節(jié)將放棄游戲業(yè)務(wù)的同一天,字節(jié)跳動傳出已成立了一個新AI部門Flow。

緊接著,字節(jié)系各類AI應(yīng)用如流水線上的產(chǎn)品一般,快速涌向市場。據(jù)硅星人統(tǒng)計,2024年至今,字節(jié)在國內(nèi)外推出包括「豆包」在內(nèi)的20余款A(yù)pp,從集成式的聊天助手,到圖像、視頻、音樂等效率工具,加速滲透到教育、辦公助手、開發(fā)平臺、代碼生成等行業(yè),而且,這些應(yīng)用的表現(xiàn)亮眼,一個個在AI應(yīng)用大亂斗里殺出重圍。

今年3月「豆包」的下載量和月活躍用戶開始雙雙登頂。而據(jù)a16z發(fā)布的全球Top 100 AI應(yīng)用榜單顯示,字節(jié)系的Cici、Coze、Gauth、Hypic、CapCut五款產(chǎn)品名列前茅。與此同時,字節(jié)依然不斷在海外推出新的產(chǎn)品進行試點。

微信圖片_20241024103804.png

10月份,這種勢頭仍在繼續(xù),據(jù)Sensor Tower10月份最新數(shù)據(jù)免費榜前10中,Gauth排名第六、TikTok排名第七、CapCut排名第九。

這些都是令所有AI應(yīng)用創(chuàng)業(yè)者眼饞的成績。字節(jié)AI究竟為何能如此兇猛?

重啟“APP工廠”

字節(jié)系A(chǔ)I產(chǎn)品全線突飛猛進的同時,許多人越來越明顯感到一絲熟悉的味道——“APP工廠”回來了。

在移動互聯(lián)網(wǎng)時期,“App工廠”的打法是字節(jié)快速開疆擴土的重要策略之一。公開數(shù)據(jù)顯示,2018年-2020年,也就是字節(jié)增長最為迅速的幾年間,它自研和收購了大量的項目,其中在App Store上線的應(yīng)用就有約140個,占其成立以來的七成。

期間,字節(jié)通過批量生產(chǎn),在今日頭條和抖音之后,也成功推出了剪映、懂車帝、皮皮蝦、番茄小說、輕顏相機等爆款。

從2023年11月,APP工廠在AI時代重啟了,字節(jié)陸續(xù)密集上線了眾多APP。經(jīng)硅星人整理如下表:

微信圖片_20241024103812.png

值得注意的是,其中海內(nèi)外產(chǎn)品幾乎一比一對應(yīng),一部分國內(nèi)產(chǎn)品如豆包、剪映復(fù)制到國外;另一部分則是在海外高排名的產(chǎn)品復(fù)制回國內(nèi)。

在整理的過程中我們發(fā)現(xiàn),不少產(chǎn)品的名字在幾個月內(nèi)頻繁變動,比如對標星野的AnyDoor,早期進入國內(nèi)時名為「話爐」,在今年4月份名稱改為「貓箱」,「河馬愛學(xué)」改名為「豆包愛學(xué)」等等。

這背后是字節(jié)系產(chǎn)品對于AI產(chǎn)品命名和定位的思考。

彼時大模型產(chǎn)品的命名常常引經(jīng)據(jù)典,與文心、通義、混元、星火、天工相比,「豆包」聽起來土味十足。“當時準備將Grace推向市場的時候,內(nèi)部一致認為必須要改名,要做中國市場,英文名限制太大。陸陸續(xù)續(xù)起了100多個名字,有一部分有硬傷直接被Pass了,剩下的做了一些田野調(diào)查,有負面關(guān)聯(lián)又淘汰了一部分,最終是朱駿拍板定了「豆包」這個名字。”

豆包團隊的人員告訴我們:“我們私底下討論過,豆包這個詞在中國的滲透率差不多80%-90%,沒有硬傷。字節(jié)內(nèi)部起名字有一整套的流程,再經(jīng)歷田野調(diào)查,這個名字有沒有什么負面關(guān)聯(lián)。”

相比于創(chuàng)業(yè)公司和其他互聯(lián)網(wǎng)大廠,字節(jié)的優(yōu)勢在于成熟的產(chǎn)品方法論,來保證產(chǎn)品的水平在60分以上,形成穩(wěn)定的產(chǎn)出。

而在場景的選擇上,目前根據(jù)我們整理的結(jié)果發(fā)現(xiàn),字節(jié)系產(chǎn)品其實并沒有真正在開拓新的場景,它其實很少“教育市場”,而是更多“順應(yīng)市場”,在已經(jīng)被部分驗證的場景下進行產(chǎn)品的迭代和優(yōu)化。同時,海外市場更多承擔新產(chǎn)品孵化地的角色,產(chǎn)品在國內(nèi)和國外是隔離的,通常一側(cè)上線,完成市場和用戶數(shù)據(jù)分析后再在另一側(cè)上線類似產(chǎn)品。

簡單地說,它的策略就是復(fù)制小爆款,成為大爆款。

比如「豆包」雖然推出得晚,但上線便集齊了對話、Agent、語音通話等當時分散在不同產(chǎn)品中的大模型功能,「貓箱」完全對標「星野」、「星繪」對標「妙鴨」、「海綿音樂」對標「Suno」,在此基礎(chǔ)上,結(jié)合用戶體驗對產(chǎn)品進行迭代。

哪些產(chǎn)品要放棄,哪些產(chǎn)品又要繼續(xù)投入資源?答案依然是,數(shù)據(jù)。

字節(jié)跳動有專門負責產(chǎn)品增長的團隊。這個團隊構(gòu)建了一個強大的數(shù)據(jù)監(jiān)測系統(tǒng),他們會花大價錢去買市面上的數(shù)據(jù),盡可能監(jiān)控所有產(chǎn)品,用來指導(dǎo)研發(fā)。

基于信息差的實驗+地毯式孵化+數(shù)據(jù)增長,形成了一條新的AI APP生產(chǎn)線。

爭奪“豆包”,模型也賽馬

App工廠的背后,是字節(jié)式的賽馬機制。

“Grace是2022年我們團隊開發(fā)的,在字節(jié)內(nèi)部使用的產(chǎn)品,員工可以用它來學(xué)習一下內(nèi)部資料。”豆包初始團隊的同學(xué)告訴硅星人:“到了2023年年初,字節(jié)內(nèi)部有好幾個團隊還有自發(fā)組成的新團隊,都在嘗試新產(chǎn)品,但我們團隊因為做得早,有產(chǎn)品雛形,公司開始計劃基于原來的框架推一個移動端的產(chǎn)品。”

「豆包」誕生初期,賽馬并沒有那么激烈,隨著AI產(chǎn)品戰(zhàn)略逐漸明確,內(nèi)部也逐漸開始了新一輪的賽馬。

據(jù)硅星人了解,目前字節(jié)內(nèi)部形成了多輪賽馬制:

第一階段,創(chuàng)新產(chǎn)品中心負責前期孵化、產(chǎn)品創(chuàng)意、內(nèi)部審核以及完成產(chǎn)品的前期打造,到產(chǎn)品測試上線。在這個階段幾乎不會有流量支持,靠產(chǎn)品自身的形態(tài)吸引自然用戶;

進入第二階段的產(chǎn)品,開始可以拿到一部分初始預(yù)算進行外部推廣,由專門負責增長的團隊負責拉新留存,進行產(chǎn)品排名,數(shù)據(jù)表現(xiàn)好結(jié)合內(nèi)部分析,從創(chuàng)新產(chǎn)品中心進入到具體的產(chǎn)品組;

而第三階段,成型的產(chǎn)品開始進行大規(guī)模推廣,如「貓箱」、「星繪」從去年年底開始在抖音投流以及通過KOL推廣。

微信圖片_20241024103814.png

早期產(chǎn)品生產(chǎn)內(nèi)部架構(gòu)

“有點內(nèi)部創(chuàng)業(yè)的意思吧,項目做好了團隊內(nèi)部分獎金,大家都希望能獲得更好的資源,但產(chǎn)品這邊的競爭其實比較良性,畢竟大家并不交叉。”

不過,和移動互聯(lián)網(wǎng)時期的模式不同的是,當時所有的產(chǎn)品都是基于個性推薦算法團隊生長,而如今,在今天的AI產(chǎn)品們底下的模型層,字節(jié)其實并沒有達到統(tǒng)一。

產(chǎn)品層,豆包已經(jīng)是一個統(tǒng)一的品牌,所有產(chǎn)品向豆包靠攏。但在模型層,“豆包”更像是一個代號,究竟誰能成為“豆包”,更像是一場爭奪行動。

舉個例子,9月24日,火山引擎一口氣發(fā)布了兩款視頻生產(chǎn)模型,但對外并沒有展示詳細解釋兩款模型的差異,我們發(fā)現(xiàn)PixelDance和Seaweed在發(fā)布前,在Github上發(fā)布過對應(yīng)的模型細節(jié),它們分別屬于兩個團隊,但最終均被冠以“豆包”之名對外發(fā)布。

從內(nèi)部結(jié)構(gòu)來看,模型和算法歸屬于模型算法團隊Seed,由朱文佳(曾任TikTok產(chǎn)品技術(shù)負責人)負責;2023年11月成立的Flow團隊主要負責打造C端產(chǎn)品,在最新的人事調(diào)動中顯示,朱文佳為整體業(yè)務(wù)負責人、朱駿(原Music.ly創(chuàng)始人、原TikTok負責人)為產(chǎn)品負責人、洪定坤為技術(shù)負責人,向下包括豆包、AI教育、社區(qū)、國際化四個部門,同時PC端和移動端也分為兩條業(yè)務(wù)線;而豆包大模型to B的商業(yè)化業(yè)務(wù)主要由火山引擎對外提供,并通過API的方式接入飛書。

Seed團隊由原來的搜索團隊、AILab團隊、AML團隊聯(lián)合而成,但實際上,這幾個團隊都在暗自較勁。

“現(xiàn)在的豆包更像是一個統(tǒng)一的出口,連接用戶。豆包產(chǎn)品后端連接了多個模型測試,是一個訓(xùn)練場,通過API的結(jié)果反饋來評測模型效果,但一時間很難有取舍。”上述內(nèi)部人士講道。

在GitHub和HuggingFace上面,字節(jié)的各類視頻和圖像模型,都分屬于各個小團隊,包含有4款不同功能的視頻模型。

微信圖片_20241024103816.jpg

根據(jù)公開資料和介紹,我們整理了各個模型的功能,發(fā)現(xiàn)目前主流視頻模型的能力散落在了各個模型里,比如視頻編輯、運動筆刷、端到端視頻生成等等,也有在Github上評分較高的開源模型,顯示測試效果比已在國內(nèi)發(fā)布的PixelsDance要更好。

微信圖片_20241024103819.png

比如MagicVideo的V2版本是目前開發(fā)者評價字節(jié)旗下最可用的一款文生視頻模型,V2版本采用了模塊化式生產(chǎn)流程,第一模塊從文本到圖像、第二模塊從圖像到視頻生產(chǎn)關(guān)鍵幀、第三模塊從視頻到視頻擴展、第四模塊視頻幀插值,平滑過渡。目前整體的生成效果、色彩和審美高于Pika1.0和Gen2.0。

微信圖片_20241024103821.jpg

有算法工程師就分析道:“如果幾個模型的能力加起來,其實會比現(xiàn)在公開發(fā)布的版本更好,至少能達到可靈的效果,但是現(xiàn)在發(fā)布版本比較一般,可能也是內(nèi)部賽馬資源沒有談妥的結(jié)果。”

字節(jié)AI產(chǎn)品今天的突飛猛進,是其賽馬機制下,一套屢試不爽的產(chǎn)品開發(fā)方法論加持的結(jié)果。但與移動互聯(lián)網(wǎng)時代字節(jié)的“生產(chǎn)體系”很不同的是,今天在底層的模型側(cè),字節(jié)也在進行著賽馬。

字節(jié)可能寄希望于它也像應(yīng)用一樣,百花齊放后篩選出最強的那一個,但同時它也客觀上帶來著資源無法集中的問題。尤其是在一個最需要大力出奇跡的時刻,這可能也會帶來新的挑戰(zhàn)。

THEEND

最新評論(評論僅代表用戶觀點)

更多
暫無評論