為什么很多機器學(xué)習(xí)策略會失敗

毫無疑問,機器學(xué)習(xí)在幾乎每個領(lǐng)域都有美好的應(yīng)用前景。將機器學(xué)習(xí)模型應(yīng)用到實際工作中的一些好處是降低成本、提高精度、更好的客戶體驗以及推出新功能,但是機器學(xué)習(xí)并不是萬能的,在將人工智能和機器學(xué)習(xí)技術(shù)應(yīng)用到組織的業(yè)務(wù)和運營之前,必須克服一些障礙。

根據(jù)云計算服務(wù)提供商Rackspace Technology公司最近進行的一項調(diào)查,大多數(shù)組織都在努力制定可行的人工智能策略。這項調(diào)查涵蓋了制造、金融、零售、政府以及醫(yī)療保健等各行業(yè)領(lǐng)域的1,870個組織。調(diào)查表明,只有20%的組織擁有成熟的人工智能/機器學(xué)習(xí)計劃,而其余的組織仍在試圖弄清楚如何讓其發(fā)揮更大的作用。

毫無疑問,機器學(xué)習(xí)在幾乎每個領(lǐng)域都有美好的應(yīng)用前景。將機器學(xué)習(xí)模型應(yīng)用到實際工作中的一些好處是降低成本、提高精度、更好的客戶體驗以及推出新功能,但是機器學(xué)習(xí)并不是萬能的,在將人工智能和機器學(xué)習(xí)技術(shù)應(yīng)用到組織的業(yè)務(wù)和運營之前,必須克服一些障礙。

組織在將人工智能技術(shù)整合到運營中時面臨的三個關(guān)鍵挑戰(zhàn)是技能、數(shù)據(jù)和策略,Rackspace公司的調(diào)查報告清楚地說明了一些機器學(xué)習(xí)策略遭遇失敗的原因。

機器學(xué)習(xí)與數(shù)據(jù)有關(guān)

機器學(xué)習(xí)模型以計算資源和數(shù)據(jù)為基礎(chǔ)。采用云計算服務(wù),對訓(xùn)練和運行人工智能模型所需的硬件的訪問變得更加容易和負擔得起。

但在計劃和采用人工智能戰(zhàn)略的不同階段,數(shù)據(jù)仍然是一個主要障礙。在Rackspace公司的調(diào)查中,34%的受訪者表示,數(shù)據(jù)質(zhì)量較差是機器學(xué)習(xí)研發(fā)失敗的主要原因,另有31%的受訪者表示,他們?nèi)狈ΜF(xiàn)成的生產(chǎn)數(shù)據(jù)。

這凸顯了將機器學(xué)習(xí)技術(shù)應(yīng)用于現(xiàn)實問題時的主要障礙之一。盡管人工智能研究社區(qū)可以訪問許多公共數(shù)據(jù)集來訓(xùn)練和測試其最新的機器學(xué)習(xí)技術(shù),但要將這些技術(shù)應(yīng)用于應(yīng)用程序時,要獲得高質(zhì)量的數(shù)據(jù)并不容易。這在工業(yè)、衛(wèi)生和政府部門尤其如此,因為這些部門的數(shù)據(jù)往往很少或受到嚴格的監(jiān)管。

當機器學(xué)習(xí)計劃從研究階段轉(zhuǎn)移到生產(chǎn)階段時,數(shù)據(jù)問題再次出現(xiàn)。在使用機器學(xué)習(xí)來提取具有價值的見解方面,數(shù)據(jù)質(zhì)量仍然是最大的障礙。數(shù)據(jù)工程問題也帶來了一個嚴重的問題,例如數(shù)據(jù)孤島、缺乏連接不同數(shù)據(jù)源的人才,以及以更具意義的方式處理數(shù)據(jù)的速度不夠快。

數(shù)據(jù)是從機器學(xué)習(xí)模型中獲取可行見解時最關(guān)鍵的要素

Rackspace Technology公司首席技術(shù)官Jeff DeVerter表示,初創(chuàng)企業(yè)和成熟企業(yè)都面臨數(shù)據(jù)問題,不過規(guī)模是兩者之間的關(guān)鍵區(qū)別。DeVerter評論說:“初創(chuàng)企業(yè)往往沒有足夠的資源來實施高質(zhì)量的數(shù)據(jù)管道,并隨著時間的推移對其進行持續(xù)的管理。而成熟企業(yè)通常更具規(guī)模,而面臨的是更嚴格的要求。”

組織應(yīng)對人工智能策略的數(shù)據(jù)挑戰(zhàn)的最佳方法是對其數(shù)據(jù)基礎(chǔ)設(shè)施進行全面評估。消除孤島應(yīng)該成為每個機器學(xué)習(xí)計劃中的關(guān)鍵優(yōu)先事項。組織還應(yīng)具有清理數(shù)據(jù)的正確程序,以提高其機器學(xué)習(xí)模型的準確性和性能。

對人工智能的人才需求仍然很高

對于大多數(shù)組織來說,面臨的第二個難題是獲取機器學(xué)習(xí)和數(shù)據(jù)科學(xué)人才。根據(jù)Rackspace公司的調(diào)查,缺乏內(nèi)部專業(yè)知識是導(dǎo)致機器學(xué)習(xí)項目研發(fā)計劃失敗的第二大原因。

許多公司都在努力獲取人才以實施其人工智能策略

隨著機器學(xué)習(xí)和深度學(xué)習(xí)直到最近才在各行業(yè)組織的生產(chǎn)環(huán)境中得到主流應(yīng)用,許多規(guī)模較小的組織并不具備開發(fā)人工智能模型的數(shù)據(jù)科學(xué)家和機器學(xué)習(xí)工程師。

而且數(shù)據(jù)科學(xué)家和機器學(xué)習(xí)工程師的平均薪酬與經(jīng)驗豐富的軟件工程師相當,這使得許多組織難以組建一支能夠領(lǐng)導(dǎo)其人工智能計劃的優(yōu)秀團隊。

雖然機器學(xué)習(xí)和數(shù)據(jù)科學(xué)人才的短缺是眾所周知的,但有一件事并沒有引起人們的關(guān)注,那就是需要招募更多的數(shù)據(jù)工程師,即建立、維護和更新數(shù)據(jù)庫、數(shù)據(jù)倉庫和數(shù)據(jù)湖的工作人員。根據(jù)Rackspace公司的調(diào)查,許多組織的機器學(xué)習(xí)的項目都失敗了,因為他們沒有能力將其數(shù)據(jù)基礎(chǔ)設(shè)施調(diào)整為機器學(xué)習(xí)的目的。打破孤島、遷移到云平臺、建立Hadoop集群,以及創(chuàng)建能夠利用不同平臺能力的混合系統(tǒng),這些都是組織非常缺乏相關(guān)人才的領(lǐng)域。這些問題使得他們無法在組織范圍內(nèi)落實機器學(xué)習(xí)計劃。

隨著新的機器學(xué)習(xí)和數(shù)據(jù)科學(xué)工具的發(fā)展,人才短缺問題將變得不那么突出。谷歌、微軟和亞馬遜已經(jīng)推出了一些平臺,使得開發(fā)機器學(xué)習(xí)模型更加容易。微軟的Azure機器學(xué)習(xí)服務(wù)就是一個例子,它提供了一個帶有拖放組件的可視化界面,使得不需要編程就可以更容易地創(chuàng)建機器學(xué)習(xí)模型。另一個例子是谷歌公司的AutoML,它可以自動完成繁瑣的超參數(shù)調(diào)優(yōu)過程。雖然這些工具并不能取代機器學(xué)習(xí)人才,但它們?yōu)橄胍M入該領(lǐng)域的人員降低了門檻,并將使許多組織能夠為這些不斷增長的領(lǐng)域招聘更多技術(shù)人才。

DeVerter說:“缺乏內(nèi)部數(shù)據(jù)科學(xué)人才并不是過去的障礙,現(xiàn)在更多的組織能夠利用自己的機器學(xué)習(xí)提供幫助,以及可以獲得擁有這些人才的咨詢公司的幫助。”

該領(lǐng)域的其他發(fā)展是云存儲和分析平臺的發(fā)展,這顯著降低了創(chuàng)建和運行人工智能系統(tǒng)所需的數(shù)據(jù)基礎(chǔ)設(shè)施的復(fù)雜性。其中一個例子就是谷歌公司的BigQuery,這是一個基于云計算的數(shù)據(jù)倉庫,可以輕松地查詢存儲在各種來源中的大量數(shù)據(jù)。

機器學(xué)習(xí)工具的兼容性和集成功能正在不斷增強,這將使組織更輕松地將機器學(xué)習(xí)工具集成到其現(xiàn)有軟件和數(shù)據(jù)生態(tài)系統(tǒng)中。

在實施人工智能計劃之前,每個組織都必須對內(nèi)部人才、可用工具和集成可能性進行全面評估。組織需要了解自己在多大程度上依賴內(nèi)部工程師,以及雇傭人才需要多少成本,這將成為決定機器學(xué)習(xí)計劃成敗的決定性因素。另外,考慮一下重新學(xué)習(xí)技能是否是一個可行的行動方案。如果能在數(shù)據(jù)科學(xué)和機器學(xué)習(xí)項目上提高工程師的技能,從長遠的發(fā)展來看將會獲得更多的好處。

外包人工智能的人才

近年來增長的另一個趨勢是人工智能項目的外包。在Rackspace公司的調(diào)查中,只有38%的受訪者表示依靠內(nèi)部人才來開發(fā)人工智能應(yīng)用程序。其余的受訪者表示,或者完全外包他們的人工智能項目,或者雇用內(nèi)部員工和外包人才。

大多數(shù)組織依靠外部人才來規(guī)劃和實施他們的人工智能計劃

現(xiàn)在有一些公司專門研究和實施人工智能策略。例如專門為多個行業(yè)領(lǐng)域提供人工智能解決方案的提供商C3.ai公司。該公司為亞馬遜、微軟和谷歌等云計算提供商提供人工智能工具。該公司還提供人工智能咨詢和專業(yè)知識,以逐步引導(dǎo)客戶完成戰(zhàn)略制定和實施階段。

Rackspace公司的調(diào)查報告指出:“成熟的供應(yīng)商可以帶來從戰(zhàn)略到實施,再到維護和支持的一切。其提供的策略可以避開人工智能和機器學(xué)習(xí)工作可能失去動力或陷入復(fù)雜性的領(lǐng)域。技術(shù)專家還可以使組織免于混亂的清理和維護工作。將這些專門知識組合在一起,可以在最終取得成功方面發(fā)揮重要作用。”

但是,值得注意的是,將組織的人工智能戰(zhàn)略完全移交給外部提供商可能是一把雙刃劍。成功的策略需要人工智能專家與實施該策略組織的技術(shù)專家之間的密切合作。

DeVerter說,“這與采用DevOps開發(fā)方法并試圖將整個開發(fā)進行外包的組織非常相似。DevOps需要開發(fā)人員、業(yè)務(wù)分析師和其他業(yè)務(wù)人員之間的密切合作。同樣,人工智能項目需要策略和技術(shù)專長,但也需要與組織以及領(lǐng)導(dǎo)層緊密合作。”

人工智能外包人才必須一絲不茍地完成工作。雖然外包可以加快開發(fā)和實施人工智能策略的過程,但組織必須確保其內(nèi)部人員充分參與到這一過程中。在理想情況下,組織應(yīng)該發(fā)展和壯大自己的數(shù)據(jù)科學(xué)家和機器學(xué)習(xí)工程師團隊,并在需要的情況下與外部專家開展合作。

如何評估人工智能策略?

最后,另一個讓開始人工智能之旅的組織感到痛苦的領(lǐng)域是預(yù)測人工智能戰(zhàn)略的結(jié)果和價值。鑒于機器學(xué)習(xí)在許多領(lǐng)域的應(yīng)用都是新生事物,因此很難預(yù)先知道人工智能策略將計劃和實施多長時間以及投資回報率是多少。反過來,在獲得對人工智能計劃的支持時,組織的創(chuàng)新者很難讓其他人參與進來。

在Rackspace調(diào)查的中,18%的受訪者認為,缺乏明確的業(yè)務(wù)案例是組織采用人工智能策略面臨的主要障礙。組織高管人員缺乏承諾也是最大的障礙之一。缺乏用例和高級管理層的承諾再次成為機器學(xué)習(xí)過程中的主要挑戰(zhàn)。

DeVerter說,“人工智能通常會尋找組織內(nèi)部的問題。我認為這是在組織內(nèi)部廣泛采用人工智能的最大障礙之一。由于人工智能工作人員可以展示有關(guān)人工智能如何使他們的組織受益的實例,將進一步為這些活動獲得資金。組織領(lǐng)導(dǎo)者需要知道它將如何幫助節(jié)省成本或獲得利潤。”

評估人工智能計劃的結(jié)果非常困難。調(diào)查表明,衡量人工智能項目成功與否的兩大關(guān)鍵績效指標是利潤率和收入增長??梢岳斫?,這種對快速利潤的關(guān)注部分是由于人工智能項目的高成本。根據(jù)Rackspace公司的調(diào)查,每家組織每年在人工智能項目花費的費用平均為106萬美元。

但是,盡管良好的人工智能計劃可以增加收入和降低成本,但在許多情況下,機器學(xué)習(xí)的長期價值是開發(fā)新的用例和產(chǎn)品。

DeVerter說:“短期的財務(wù)收益如果沒有與由這些短期收益提供資金的長期戰(zhàn)略相匹配,那么這種收益不會長久。”

對于負責組織中的人工智能計劃的工作人員來說,需要清楚地列出人工智能策略的用例、成本和收益。組織的決策者應(yīng)清楚了解將要開展的工作。他們應(yīng)該了解投資人工智能的短期利益,但也應(yīng)該知道從長遠來看會獲得什么收益。

THEEND

最新評論(評論僅代表用戶觀點)

更多
暫無評論