趨勢丨下一代 AutoAI:算法的迭代變成數(shù)據(jù)的迭代

方文三
整個建模過程端到端的自動化可以顯著節(jié)省資源。AutoAI顯著提高了生產(chǎn)力,只需點擊幾下鼠標,即使是只有基本數(shù)據(jù)科學技能的人,也可以使用自定義數(shù)據(jù)自動選擇、訓練并調(diào)優(yōu)高性能機器學習模型。

本文來自AI芯天下,作者/方文三。

深度學習問世以來,隨著神經(jīng)網(wǎng)絡架構趨于固定和成熟,轉而尋找改進數(shù)據(jù)的方法,已經(jīng)成了AI研發(fā)的新出口。

AutoAI自動執(zhí)行高度復雜的任務,為數(shù)據(jù)尋找并優(yōu)化最好的機器學習模型、特征和模型超參數(shù)。

QQ截圖20220104093506.png

AutoAI在人工智能全生命周期中自動建模

AutoAI是最先進的自動化機器學習產(chǎn)品可以有效地分析歷史數(shù)據(jù),創(chuàng)建自定義機器學習管道并對其進行排名。

它包括自動化特征工程——可擴展和增強數(shù)據(jù)的特征空間以優(yōu)化模型性能。

AutoAI可以在幾分鐘內(nèi)完成通常需要整個數(shù)據(jù)科學家團隊數(shù)個小時到數(shù)天才能完成的工作。自動化功能包括數(shù)據(jù)準備、模型開發(fā)、特征工程和超參數(shù)優(yōu)化。

整個建模過程端到端的自動化可以顯著節(jié)省資源。AutoAI顯著提高了生產(chǎn)力,只需點擊幾下鼠標,即使是只有基本數(shù)據(jù)科學技能的人,也可以使用自定義數(shù)據(jù)自動選擇、訓練并調(diào)優(yōu)高性能機器學習模型。

然而,專業(yè)的數(shù)據(jù)科學家可以快速迭代可能的模型和管道,并試驗最新的模型、特征工程技術和公平算法,無需從頭開始編寫管道代碼就可以完成這一切。

QQ截圖20220104093506.png

數(shù)據(jù)科學家的新語義能力

數(shù)據(jù)科學家理解了數(shù)據(jù)的語義,就有可能利用領域知識來擴展特征空間,從而提高模型準確性,這種擴展可以使用來自內(nèi)部或外部數(shù)據(jù)源的補充數(shù)據(jù)來完成。

AutoAI檢測到正確的語義概念,程序就會使用這些概念廣泛搜索現(xiàn)有代碼、數(shù)據(jù)和文獻中可能存在的相關特征和特征工程操作。

AutoAI可以使用這些新的、語義豐富的特征來提高生成模型的準確性,并通過這些生成的特征提供可供人類閱讀的解釋。

即使沒有評估這些語義概念或者新功能的專業(yè)知識,數(shù)據(jù)科學家們還是可以試用AutoAI。但是,想要理解發(fā)現(xiàn)的語義概念并與之交互的數(shù)據(jù)科學家可以使用Semantic Feature Discovery(語義特征發(fā)現(xiàn))可視化資源管理器來探索發(fā)現(xiàn)的關系。

QQ截圖20220104093506.png

AutoAI的三個階段

第一階段:模型設計、調(diào)參自動化

當前,很多學者都已經(jīng)注意到,學術界或者工業(yè)界的優(yōu)秀人才所聚焦的研發(fā),花費太多時間用于模型結構設計以及調(diào)參,但實際上它本不應該成為研究的主要內(nèi)容。有沒有一種自動化的方法,讓深度學習的網(wǎng)絡架構在面對一個問題的時候,能自主的演化其架構,這才是關鍵。

第二階段:簡單模型訓練的軟件化

第一階段的自動化主要面向專業(yè)的算法研究人員,第二階段的系統(tǒng)化則面向一般的AI從業(yè)人員。主要目標是在給定標注好的數(shù)據(jù)的情況下,通過可視化的操作界面實現(xiàn)模型的訓練。

第三階段:數(shù)據(jù)迭代自動化

在算法設計自動化的基礎上,正在發(fā)生一些變化。模型和數(shù)據(jù)到底哪一個更重要,在設計化的工業(yè)生產(chǎn)中,以模型為中心的技術研發(fā)已經(jīng)轉化成以數(shù)據(jù)為中心的技術研發(fā)。

QQ截圖20220104093506.png

數(shù)據(jù)的迭代越來越重要

在工業(yè)化大規(guī)模發(fā)展中,大家正在慢慢地從模型為中心的生產(chǎn)轉化為以數(shù)據(jù)為中心。

可從兩個維度來提高它的性能,一是以模型為中心的方法,即想盡各種辦法提高模型設計的復雜度、技術含量等;

二是以數(shù)據(jù)為中心的方法,比如加數(shù)據(jù)(加數(shù)據(jù)也是有一些科學方法的,并不是加了數(shù)據(jù)后性能一定會提高)、檢查數(shù)據(jù)有沒有問題等等。

會發(fā)現(xiàn),以數(shù)據(jù)為中心的方法比以模型為中心的方法能更多地提高性能。

做模型生產(chǎn)時也得到這樣一個結論:越到后面,數(shù)據(jù)的迭代越來越重要。因為所有模型的服務實際上是針對某一個特定場景,使用的是特定的數(shù)據(jù)。

QQ截圖20220104093506.png

結尾:AutoAI未來適配率極高

如今,有自動化AI模型生產(chǎn)平臺需求的,已經(jīng)不僅僅是谷歌、微軟、Meta、IBM、蘋果等大公司了,我們國內(nèi)就有不少房地產(chǎn)公司開始投入AI。他們都有人才的需求,自動化的AI可以降低他們的成本。地產(chǎn)公司、物業(yè)公司,以及像寧德時代這樣做電池的公司,都在慢慢引入AI來解決實際問題。

AI是一個非?;A的能力,可以提高我們做事情的效率,AI并不改變行業(yè),但是可以提升所在行業(yè)的生產(chǎn)效率,所以這種影響是全方位的,已經(jīng)慢慢地波及到非技術類公司了。

更不用說現(xiàn)在廣泛的制造業(yè),制造過程中的很多環(huán)節(jié)都可以利用到AI的能力。如果想提高自己的國際競爭力,提升自己的生產(chǎn)質量,就需要AI的能力去賦能生產(chǎn)。

部分內(nèi)容來源于:雷鋒網(wǎng):下一代AutoAI:從模型為中心,到數(shù)據(jù)為中心;至頂頭條:IBM的AutoAI讓數(shù)據(jù)科學家更高效,但可怕的是它正在變得太智能了;AI科技評論:下一代AutoAI:從模型為中心,到數(shù)據(jù)為中心

THEEND

最新評論(評論僅代表用戶觀點)

更多
暫無評論