87%的機(jī)器學(xué)習(xí)項(xiàng)目失敗的十大原因

如今人們總是能聽(tīng)到有關(guān)機(jī)器學(xué)習(xí)的新聞,而機(jī)器學(xué)習(xí)技術(shù)確實(shí)有更多發(fā)展?jié)摿?。調(diào)研機(jī)構(gòu)Gartner公司預(yù)測(cè),對(duì)于很多組織來(lái)說(shuō),80%的人工智能項(xiàng)目仍是一種難以獲得成功的煉金術(shù)。根據(jù)VentureBeat公司發(fā)布的“Transform2019”研究報(bào)告,87%的人工智能項(xiàng)目將永遠(yuǎn)無(wú)法投入生產(chǎn)。

如今人們總是能聽(tīng)到有關(guān)機(jī)器學(xué)習(xí)的新聞,而機(jī)器學(xué)習(xí)技術(shù)確實(shí)有更多發(fā)展?jié)摿ΑU{(diào)研機(jī)構(gòu)Gartner公司預(yù)測(cè),對(duì)于很多組織來(lái)說(shuō),80%的人工智能項(xiàng)目仍是一種難以獲得成功的煉金術(shù)。根據(jù)VentureBeat公司發(fā)布的“Transform2019”研究報(bào)告,87%的人工智能項(xiàng)目將永遠(yuǎn)無(wú)法投入生產(chǎn)。

為什么會(huì)這樣呢?為什么這么多項(xiàng)目失敗?

1.沒(méi)有足夠的專(zhuān)業(yè)知識(shí)

其中一個(gè)原因是,機(jī)器學(xué)習(xí)技術(shù)對(duì)人們來(lái)說(shuō)仍然是新技術(shù)。此外,大多數(shù)組織仍不熟悉軟件工具和所需的硬件。

如今,從事數(shù)據(jù)分析或軟件開(kāi)發(fā)工作并完成了一些數(shù)據(jù)科學(xué)項(xiàng)目的一些人卻將自己標(biāo)榜為數(shù)據(jù)科學(xué)家。

事實(shí)上,組織需要經(jīng)驗(yàn)豐富的真正數(shù)據(jù)科學(xué)家來(lái)處理大多數(shù)機(jī)器學(xué)習(xí)和人工智能項(xiàng)目,尤其是在定義成功標(biāo)準(zhǔn)、最終部署和模型的持續(xù)監(jiān)控方面。

2.數(shù)據(jù)科學(xué)與傳統(tǒng)軟件開(kāi)發(fā)之間的脫節(jié)

數(shù)據(jù)科學(xué)與傳統(tǒng)軟件開(kāi)發(fā)之間的脫節(jié)是另一個(gè)主要因素。傳統(tǒng)的軟件開(kāi)發(fā)往往更具可預(yù)測(cè)性和可衡量性。

數(shù)據(jù)科學(xué)研究通過(guò)多次迭代和試驗(yàn)而向前發(fā)展。有時(shí),由于選擇的度量標(biāo)準(zhǔn)不會(huì)驅(qū)動(dòng)用戶(hù)行為,因此整個(gè)項(xiàng)目將不得不從部署階段返回到計(jì)劃階段。

傳統(tǒng)的基于敏捷的項(xiàng)目交付可能不適用于數(shù)據(jù)科學(xué)項(xiàng)目。對(duì)于在常規(guī)軟件開(kāi)發(fā)項(xiàng)目的每個(gè)任務(wù)周期結(jié)束時(shí)一直在努力交付清晰結(jié)果的領(lǐng)導(dǎo)者來(lái)說(shuō),這將造成大規(guī)模的混亂。

3.數(shù)據(jù)量和質(zhì)量

眾所周知,數(shù)據(jù)集越大,采用人工智能系統(tǒng)進(jìn)行的預(yù)測(cè)就越好。除了數(shù)據(jù)量增加的直接影響之外,隨著數(shù)據(jù)量的增加,還會(huì)出現(xiàn)許多新的挑戰(zhàn)。

在許多情況下,組織將不得不合并來(lái)自多個(gè)源的數(shù)據(jù)。一旦開(kāi)始這樣做,就會(huì)意識(shí)到它們同步的次數(shù)很少,這將導(dǎo)致很多混亂。有時(shí),組織最終將合并不應(yīng)該合并的數(shù)據(jù),這將導(dǎo)致數(shù)據(jù)點(diǎn)具有相同的名稱(chēng)但含義不同。

錯(cuò)誤的數(shù)據(jù)會(huì)帶來(lái)無(wú)法采取行動(dòng)或無(wú)法提供真知灼見(jiàn)的結(jié)果,也會(huì)導(dǎo)致誤導(dǎo)性結(jié)果。

4. 標(biāo)記數(shù)據(jù)

標(biāo)記數(shù)據(jù)的不可用是另一個(gè)阻礙機(jī)器學(xué)習(xí)項(xiàng)目的挑戰(zhàn)。《麻省理工學(xué)院斯隆管理評(píng)論》雜志指出,76%的人通過(guò)嘗試自己標(biāo)記和注釋訓(xùn)練數(shù)據(jù)來(lái)應(yīng)對(duì)這一挑戰(zhàn),而63%的人甚至嘗試構(gòu)建自己的標(biāo)記和注釋自動(dòng)化技術(shù)。

這意味著數(shù)據(jù)科學(xué)家在標(biāo)記過(guò)程中無(wú)法充分利用其專(zhuān)業(yè)知識(shí)。這是有效執(zhí)行人工智能項(xiàng)目的主要挑戰(zhàn)。

這就是許多公司將標(biāo)記任務(wù)外包給其他公司的原因。但是,如果標(biāo)記任務(wù)需要足夠的領(lǐng)域知識(shí),則將標(biāo)記任務(wù)外包是一個(gè)挑戰(zhàn)。如果組織需要保持?jǐn)?shù)據(jù)集之間的質(zhì)量和一致性,則必須投資于標(biāo)記人員的標(biāo)準(zhǔn)化培訓(xùn)。

如果要標(biāo)記的數(shù)據(jù)很復(fù)雜,則另一個(gè)選擇是開(kāi)發(fā)自己的數(shù)據(jù)標(biāo)記工具。但是,與機(jī)器學(xué)習(xí)任務(wù)本身相比,這通常需要更多的成本。

5.組織孤立無(wú)援

數(shù)據(jù)是機(jī)器學(xué)習(xí)項(xiàng)目中最重要的實(shí)體。在大多數(shù)組織中,這些數(shù)據(jù)將以不同的安全約束和不同格式(例如結(jié)構(gòu)化、非結(jié)構(gòu)化、視頻文件、音頻文件、文本和圖像)駐留在不同的位置。

在不同的地方以不同的格式保存這些數(shù)據(jù)本身就是一個(gè)挑戰(zhàn)。然而,當(dāng)組織孤立無(wú)援而卻沒(méi)有相互協(xié)作時(shí),其挑戰(zhàn)就會(huì)加倍。

6.缺乏合作

另一個(gè)主要挑戰(zhàn)是不同團(tuán)隊(duì)之間缺乏協(xié)作,如數(shù)據(jù)科學(xué)家、數(shù)據(jù)工程師、數(shù)據(jù)管理員、商業(yè)智能(BI)專(zhuān)家、DevOps和工程。這對(duì)于物聯(lián)網(wǎng)到數(shù)據(jù)科學(xué)的工程方案中的團(tuán)隊(duì)尤其重要,因?yàn)樗麄冊(cè)诠ぷ鞣绞胶屯瓿身?xiàng)目所使用的技術(shù)上有很多不同。

工程團(tuán)隊(duì)將實(shí)施機(jī)器學(xué)習(xí)模型并將其投入生產(chǎn)。因此,他們之間需要有適當(dāng)?shù)睦斫夂蛷?qiáng)有力的協(xié)作。

7.技術(shù)上不可行的項(xiàng)目

由于機(jī)器學(xué)習(xí)項(xiàng)目的成本往往非常昂貴,因此大多數(shù)企業(yè)傾向于以雄心勃勃的“登月計(jì)劃”為目標(biāo),這將完全改變組織或產(chǎn)品并帶來(lái)超額回報(bào)或投資。

這樣的項(xiàng)目將永遠(yuǎn)無(wú)法完成,并將推動(dòng)數(shù)據(jù)科學(xué)團(tuán)隊(duì)達(dá)到極限。最終,企業(yè)領(lǐng)導(dǎo)者將對(duì)項(xiàng)目失去信心并停止投資。

8.技術(shù)團(tuán)隊(duì)和業(yè)務(wù)團(tuán)隊(duì)之間的協(xié)調(diào)問(wèn)題

很多時(shí)候,機(jī)器學(xué)習(xí)項(xiàng)目在業(yè)務(wù)團(tuán)隊(duì)和數(shù)據(jù)科學(xué)團(tuán)隊(duì)之間在項(xiàng)目的期望、目標(biāo)和成功標(biāo)準(zhǔn)上沒(méi)有明確的一致性。

這些類(lèi)型的項(xiàng)目將永遠(yuǎn)停留在研究階段,因?yàn)樗麄冇肋h(yuǎn)不知道自己是否正在取得進(jìn)展,因?yàn)橹两襁€不清楚其目標(biāo)是什么。

在這里,數(shù)據(jù)科學(xué)團(tuán)隊(duì)將主要專(zhuān)注于準(zhǔn)確性,而業(yè)務(wù)團(tuán)隊(duì)將對(duì)諸如財(cái)務(wù)收益或業(yè)務(wù)洞察力之類(lèi)的指標(biāo)更感興趣。最后,業(yè)務(wù)團(tuán)隊(duì)最終不接受數(shù)據(jù)科學(xué)團(tuán)隊(duì)的結(jié)果。

9.缺乏數(shù)據(jù)策略

根據(jù)《麻省理工學(xué)院斯隆管理評(píng)論》雜志的調(diào)查,員工人數(shù)超過(guò)10萬(wàn)名的大型組織將有50%可能采用數(shù)據(jù)策略。而組織在開(kāi)始機(jī)器學(xué)習(xí)項(xiàng)目之前制定可靠的數(shù)據(jù)策略至關(guān)重要。

組織需要對(duì)以下內(nèi)容有清晰的了解,這是數(shù)據(jù)策略的一部分:

組織擁有的全部數(shù)據(jù)是多少?

項(xiàng)目實(shí)際需要多少數(shù)據(jù)?

所需的人員將如何訪(fǎng)問(wèn)這些數(shù)據(jù),以及這些人員訪(fǎng)問(wèn)這些數(shù)據(jù)的容易程度?

如何將來(lái)自不同來(lái)源的所有這些數(shù)據(jù)匯總在一起?

如何清理和轉(zhuǎn)換這些數(shù)據(jù)?

大多數(shù)組織一開(kāi)始沒(méi)有計(jì)劃,或者根本沒(méi)有想到自己沒(méi)有數(shù)據(jù)。

10.缺乏領(lǐng)導(dǎo)支持

很多人認(rèn)為,只需要投入一些資金和技術(shù)來(lái)解決問(wèn)題,其結(jié)果就會(huì)自動(dòng)出現(xiàn)。

但是他們沒(méi)有看到組織領(lǐng)導(dǎo)者提供正確的支持來(lái)確保成功所需的條件,而組織領(lǐng)導(dǎo)者有時(shí)對(duì)數(shù)據(jù)科學(xué)家開(kāi)發(fā)的模型沒(méi)有信心。

這可能是由于組織的領(lǐng)導(dǎo)者對(duì)人工智能缺乏了解,以及數(shù)據(jù)科學(xué)家無(wú)法向他們傳達(dá)模型具有業(yè)務(wù)利益的原因。

最終,組織的領(lǐng)導(dǎo)者需要了解機(jī)器學(xué)習(xí)的工作原理以及人工智能對(duì)組織的真正意義。

THEEND

最新評(píng)論(評(píng)論僅代表用戶(hù)觀點(diǎn))

更多
暫無(wú)評(píng)論