“AI”的局限性:人工智能改變未來,還有一個尚未突破的問題

網(wǎng)易新聞
網(wǎng)易新聞
人工智能也將持續(xù)保持其重要的地位,在可見的將來,機器在現(xiàn)實環(huán)境進行抽象思考的能力上仍無法與人類相媲美。為了解決我們最緊迫的問題,人機交互值得重點關(guān)注。我們希望計算機能激活人類創(chuàng)造力,而不是取代人類的創(chuàng)造力。

人工智能是這個時代的箴言,技術(shù)專家、學(xué)者、記者和風險投資家都在歌頌AI。不過,就像一些從專業(yè)學(xué)術(shù)領(lǐng)域延伸到日常生活中的短語一樣,“人工智能”一詞的使用也引起巨大的爭議。

但這并不是通常情況中由于“大眾無法理解科學(xué)家”而造成的爭議,其實,科學(xué)家和大眾一樣感到困惑。一想到這個時代正在興起一種可與人類匹敵的數(shù)字智能,所有人都很興奮,但同時也會感到害怕,這會分散我們的注意力。

這是當今時代背景下一個特殊的故事,它涉及到人、計算機、數(shù)據(jù)和生與死的決定,并非人們對硅基智能的幻想。

14年前,筆者的親戚懷孕后在做超聲波檢查。房間里的遺傳學(xué)家指著胎兒心臟周圍的一些白點:“這些都是唐氏綜合癥的跡象,而胎兒患病的風險已達二十分之一。”接著,她說可以通過羊膜穿刺術(shù)發(fā)現(xiàn)胎兒是否真的有先天遺傳變異的唐氏綜合癥。但是羊膜穿刺術(shù)是有風險的,在手術(shù)中胎兒死亡率大約是1/300。

作為一名統(tǒng)計學(xué)家,筆者很想弄清楚這些數(shù)字的根據(jù)和來源。十年前,英國做過一項統(tǒng)計研究,這些代表鈣積累的白點,實際上被認定是唐氏綜合癥的預(yù)測因子。但同時我也發(fā)現(xiàn),我們測試的成像系統(tǒng)每平方英寸像素比英國分析使用的系統(tǒng)多幾百個。

我告訴遺傳學(xué)家,我認為這些白點可能是假陽性——它們只是“白噪音”。她說:“這就是幾年前唐氏綜合癥的診斷激增的原因,那時新電腦剛剛到貨。”

他們最終沒有做羊膜穿刺術(shù),幾個月后,一個健康的女孩出生了。但這件事讓我很惶恐——粗略估計,全世界有幾千人在同一天接受了這個診斷,其中許多人選擇了羊膜穿刺,許多嬰兒不必要地死去。這種情況每天都在發(fā)生,直到有一天bug被修復(fù)。

這個故事暴露的問題與我個人的醫(yī)療保健無關(guān)——這關(guān)乎一個醫(yī)療系統(tǒng),通過評估不同地點和時間的變量和結(jié)果,進行統(tǒng)計分析,并利用其他地方和不同時間的研究結(jié)果。

這樣的問題不僅和分析數(shù)據(jù)本身有關(guān),還和研究數(shù)據(jù)庫研究人員關(guān)注的“出處”掛鉤——一般來說,數(shù)據(jù)科學(xué)家們需要厘清數(shù)據(jù)來源于哪里、如何推導(dǎo)以及這些推論之于現(xiàn)狀的重要性的問題。雖然熟練的數(shù)據(jù)科學(xué)家們可以依次進行案例分析,但當今的挑戰(zhàn)是,行星規(guī)模般龐大的醫(yī)療系統(tǒng)并不需要大量的人類監(jiān)管。

我也是一名計算機科學(xué)家,碰巧在我的學(xué)校里找不到這樣的概念來構(gòu)建一個全球范圍內(nèi)的推理與決策系統(tǒng)——將計算機科學(xué)與統(tǒng)計學(xué)結(jié)合起來,并考慮到人類的效用。在我看來,發(fā)展不應(yīng)只局限于醫(yī)學(xué)領(lǐng)域,還應(yīng)涉及貿(mào)易、交通、教育等領(lǐng)域,至少要和構(gòu)建人工智能系統(tǒng)一樣重要。

無論是否能很快理解“智能”,我們都面臨著一個巨大的挑戰(zhàn),那就是如何讓機器和人類結(jié)合起來以改善人類生活。有些人認為這項任務(wù)從屬于“人工智能”的發(fā)展,但它也可以被看作是一個新的工程分支。就像過去幾十年的土木工程和化學(xué)工程一樣,這門新學(xué)科的目標是匯集幾個關(guān)鍵概念的力量,為人們提供新的工具和技能,并做到安全可靠。

土木工程和化學(xué)工程主要著眼于物理和化學(xué),而這一新的工程學(xué)科將建立在上個世紀的思想基礎(chǔ)上,諸如“知識”、“算法”、“數(shù)據(jù)”、“不確定性”、“計算”、“推理”和“優(yōu)化”。此外,這門新學(xué)科的大部分重點將是來自人類和關(guān)于人類的數(shù)據(jù),它的整體研究方向也將聚焦于此。

盡管構(gòu)建小模塊已經(jīng)出現(xiàn)了,但是指導(dǎo)這些模塊放在一起的原則還未發(fā)展,所以這些模塊是以特殊的方式放置在一起的。因此,就像在結(jié)構(gòu)工程出現(xiàn)之前設(shè)計建筑和橋梁一樣,人類正在構(gòu)建涉及計算機、人類和環(huán)境的社會規(guī)模、推理和決策結(jié)構(gòu)。

就像早期的建筑和橋梁經(jīng)常以意想不到的方式倒塌并帶來毀滅性的后果一樣,早期的許多社會推理和決策過程中也存在嚴重的概念缺陷。遺憾的是,我們并不擅長預(yù)測下一個致命錯誤的出現(xiàn),我們真正失去的是工程學(xué)科及其理論和設(shè)計概念。

通常,公共話語情景下,人們常使用人工智能AI作為分析通配符,而這使得他們很難思考新興技術(shù)的本質(zhì)和含義。下文中,筆者將更仔細地研究“AI的過去和近況”。

當今被稱為“人工智能”的事物,在過去幾十年一直被稱為“機器學(xué)習(xí)”。機器學(xué)習(xí)屬于算法領(lǐng)域,包含了來自統(tǒng)計學(xué)、計算機科學(xué)和許多其他學(xué)科的思想,以開發(fā)處理數(shù)據(jù)、預(yù)測和支持決策制定的算法。

機器學(xué)習(xí)對世界的影響由來已久。早在上世紀90年代初,機器學(xué)習(xí)就已經(jīng)很明顯地發(fā)展成為具有巨大工業(yè)意義的產(chǎn)品。而在世紀之交,機器學(xué)習(xí)開始被具有前瞻性的公司所利用。

在整個公司(如亞馬遜)內(nèi)部,機器學(xué)習(xí)已經(jīng)被應(yīng)用于解決欺詐檢測和供應(yīng)鏈預(yù)測等關(guān)鍵任務(wù)的后端問題,并開發(fā)面向消費者的突破性服務(wù),如推薦系統(tǒng)。在接下來的20年里,隨著數(shù)據(jù)集和計算資源的快速增長,很快機器學(xué)習(xí)將不僅控制亞馬遜,而且將幾乎控制任何決策可以與大規(guī)模信息相關(guān)聯(lián)的組織。

科學(xué)家預(yù)測,新的商業(yè)模式會持續(xù)發(fā)展。“數(shù)據(jù)科學(xué)”這一術(shù)語開始用于指代這一現(xiàn)象,表明機器學(xué)習(xí)算法方面的專家需要與數(shù)據(jù)庫和分布式系統(tǒng)專家協(xié)作,以創(chuàng)建可伸縮、穩(wěn)定的機器學(xué)習(xí)系統(tǒng),用以表示生成的系統(tǒng)更廣泛的社會和環(huán)境影響范圍。

回顧歷史,“人工智能”一詞在20世紀50年代末被創(chuàng)造出來,指的是一種在軟件和硬件上實現(xiàn)具有人類智能水平物體的強烈愿景。雖然已經(jīng)有了相關(guān)的學(xué)術(shù)領(lǐng)域,如運能分析、統(tǒng)計、模式識別、信息論和控制理論,這些往往受到人類智能的影響,人工智能其實是一項學(xué)術(shù)事業(yè)。

這些領(lǐng)域的靈感來自于一種能力,例如,一只松鼠能夠感知它所生活的森林的三維結(jié)構(gòu),并能在樹枝間跳躍。“人工智能”旨在專注于——人類高級的“推理”和“思考”或“認知”能力。

然而,60年后,高層次的推理和思考仍然難以捉摸?,F(xiàn)今在工程領(lǐng)域中被稱為“人工智能”的技術(shù)主要著眼于低級模式的識別和調(diào)節(jié)運動,和統(tǒng)計領(lǐng)域——在集中識別數(shù)據(jù)和趨勢后做出有根據(jù)的預(yù)測、測試假設(shè)和決定。

事實上,David Rumelhart在20世紀80年代初重新發(fā)現(xiàn)的流行“反向傳播”算法(現(xiàn)在被認為是所謂的“人工智能革命”的基石),最早出現(xiàn)在20世紀50-60年代的控制理論領(lǐng)域。它的早期用途之一是在阿波羅飛船飛向月球時改進其推力。

自20世紀60年代以來,人類科技已經(jīng)取得了重大進步,但人工智能的發(fā)展并沒有達到頂峰。相反,就像阿波羅宇宙飛船一樣,這些和研究人員的獨特技術(shù)問題相關(guān)的概念一直被隱藏在幕后。

雖然沒有明確向公眾、研究展示,但系統(tǒng)建設(shè)在文檔檢索、文本處理、垃圾郵件檢測、推薦系統(tǒng)、自定義搜索、社會網(wǎng)絡(luò)分析、準備、診斷和A/B測試領(lǐng)域取得了巨大成功。這些創(chuàng)新也推動了一些公司的發(fā)展,如Google、Netflix、Facebook和亞馬遜。

人們將這些統(tǒng)稱為AI,優(yōu)化和統(tǒng)計研究人員一夜之間被貼上“人工智能研究人員”的標簽,令人驚訝。但除此之外更嚴重的問題在于,使用這個模棱兩可的特殊字母縮寫,會妨礙人們對其涉及的知識和商業(yè)問題更為清晰的認知。

過去二十年里,在工業(yè)和研究方面,人類對于人工智能的模仿(也被稱為“信息增強”)取得了重大進展。計算和數(shù)據(jù)在這里被用來構(gòu)建提高人類智能和創(chuàng)造力。搜索引擎可以被視為IA(增強人類記憶力和事實意識)和自然語言翻譯(增強人類溝通能力)的示例,基于計算的聲音和圖像的生成是藝術(shù)家創(chuàng)造力的調(diào)色板和增強器。

盡管這些服務(wù)可能需要高級的邏輯和分析,但目前它們還沒有——它們只是執(zhí)行各種類型的字符串匹配和數(shù)字操作,以確定人類可使用的模式。

希望讀者能接受最后一個縮寫詞來代替“人工智能”,設(shè)想一個“智能基礎(chǔ)設(shè)施”(II)學(xué)科,其中存在一個能夠使人類環(huán)境更加友好、有趣和安全計算、數(shù)據(jù)和物理實體的網(wǎng)絡(luò)。這類基礎(chǔ)設(shè)施開始出現(xiàn)在交通、衛(wèi)生、貿(mào)易和金融等領(lǐng)域,對個人和社區(qū)產(chǎn)生深遠影響。

這些討論常被冠以“物聯(lián)網(wǎng)”之名,但這通常僅僅指示了互聯(lián)網(wǎng)上的問題,而非關(guān)乎抽象層次更高、能夠操縱數(shù)據(jù)流以發(fā)現(xiàn)相關(guān)環(huán)境信息和交流信息的更多問題。

在筆者看來,讀者可以想象自己生活在一個“社會規(guī)模的醫(yī)療系統(tǒng)”中。該系統(tǒng)在醫(yī)生和放置在人體內(nèi)部或周圍的設(shè)備之間創(chuàng)建數(shù)據(jù)流和數(shù)據(jù)分析流,從而使人工智能能夠進行診斷并提供治療。

該框架將整合有關(guān)人體細胞、DNA、血液樣本、氣候,種群遺傳學(xué)和大量科學(xué)文獻的藥物和治療知識。它將不僅關(guān)注單個患者和醫(yī)生,而是關(guān)注所有人類之間的關(guān)系,就像當前的醫(yī)學(xué)研究可以在一組人類(或動物)的對照下進行測試一樣。它將像現(xiàn)有銀行系統(tǒng)應(yīng)對此類財務(wù)和支付問題的方式來保留重要,出處和連續(xù)性的概念。盡管人們可能會預(yù)料到系統(tǒng)中會出現(xiàn)的一些問題,包括隱私,責任,保護問題等,但這些問題僅僅是暫時性的障礙。

現(xiàn)在需要解決的一個關(guān)鍵問題:研究經(jīng)典的人工模擬人工智能是應(yīng)對更大挑戰(zhàn)的最好或唯一方法嗎?實際上,最近有關(guān)機器學(xué)習(xí)的最為成功的案例都涉及到模仿人類的人工智能領(lǐng)域,例如計算機視覺、語音識別、游戲玩法和機器人技術(shù)。因此,也許我們只應(yīng)等待某些領(lǐng)域的進一步發(fā)展。

本文在這里聲明兩點。首先,顯而易見,人類模仿人工智能的進步是有限的,我們離實現(xiàn)人類模仿人工智能的期望還差得很遠。然而現(xiàn)實是,在模仿人類的人工智能上取得一定進步的喜悅(和恐懼)助長了人們的過度期望和媒體報道,而這其他工程領(lǐng)域所沒有的。

其次,要解決重要的IA和II問題,這些領(lǐng)域的進展還不夠充分,也不夠必要。例如無人駕駛汽車的開發(fā),需要解決各種可能與人類能力無關(guān)的工程問題。整體運輸結(jié)構(gòu)(a型結(jié)構(gòu))可能會更像目前的空中交通管制系統(tǒng),而不是目前一組松散、向前看、漫不經(jīng)心的人類駕駛員。

它將比目前的空中交通管制系統(tǒng)更為復(fù)雜,特別是在使用大數(shù)據(jù)和自適應(yīng)統(tǒng)計建模來為細粒度的決策提供信息方面。這些問題最為重要,而強調(diào)模仿人類的人工智能可能會分散人們的注意力。

至于必要性方面,通常認為模仿人類的AI同時包含了IA和II的愿望,因為模仿人類的人工智能系統(tǒng)不僅能夠解決傳統(tǒng)人工智能問題(例如圖靈測試),同時還是解決AI和II的最佳選擇。

但這種說法沒有歷史依據(jù):土木工程是通過嘗試建造一個人工木匠或砌磚工而發(fā)展起來的嗎?化學(xué)工程應(yīng)該設(shè)計來建造一個人工化學(xué)家嗎?更具有爭議性的是:如果我們的目標是建立化工廠,我們是否可以先培養(yǎng)出一個人造化學(xué)家,然后觀察他會想如何發(fā)展化工廠?

類似地,人類智能是我們所知道的唯一智能形式,第一步要努力模仿它。但事實上,人類并不擅長任何一種推理——因為人類會存在失誤、偏見和弱點。此外,從根本上說,人類還沒有進化到能夠進行現(xiàn)代II系統(tǒng)必須面對的那種大規(guī)模決策,也沒有進化到能夠應(yīng)對II環(huán)境中出現(xiàn)的模糊性。

有人可能會認為,一個人工智能系統(tǒng)不僅在模仿人類智能,而且它也會“正確”,會任意放大問題。但現(xiàn)在是在科幻小說的世界里——雖然這樣的推測在小說的背景中令人興奮,但不應(yīng)該是面對IA和II的關(guān)鍵問題時前進的關(guān)鍵策略。就它們自身而言,我們需要解決IA和II問題,而不僅僅是完全模仿人工智能的節(jié)奏。

識別不屬于II系統(tǒng)中人類模擬人工智能研究的核心主題的算法和技術(shù)并不難。II系統(tǒng)需要具備可以快速處理發(fā)展并且在全球范圍內(nèi)不連貫的分布式信息源的能力。這樣的系統(tǒng)必須在做出及時、分布式的決策時應(yīng)對云邊緣的交互作用,并且還要處理長尾現(xiàn)象,也就是一些人的數(shù)據(jù)負荷很大,而另外一些人的數(shù)據(jù)卻很少。它們必須要克服跨越機構(gòu)和競爭邊界的數(shù)據(jù)共享問題。

最重要的事情是,II系統(tǒng)必須將諸如激勵和定價這樣的經(jīng)濟理念納入可以將人與人以及有價值的商品聯(lián)系起來的統(tǒng)計和計算基礎(chǔ)設(shè)施的領(lǐng)域。這種II系統(tǒng)可能被視為制造市場,而不僅僅只是提供服務(wù)。音樂、文學(xué)和新聞業(yè)等產(chǎn)業(yè)都迫切需要這樣的市場出現(xiàn),由數(shù)據(jù)分析將生產(chǎn)者和消費者聯(lián)系起來。所有這些都必須基于新出現(xiàn)的文化、倫理和法律規(guī)范的框架才能實現(xiàn)。

當然,經(jīng)典的人類模仿人工智能問題仍然是非常有趣的。然而,現(xiàn)在過分強調(diào)通過數(shù)據(jù)收集來進行人工智能研究,實施“深度學(xué)習(xí)”基礎(chǔ)設(shè)施,以及演示模仿那些松散定義的人類技能的系統(tǒng)——幾乎沒有對進化的解釋概念——往往會分散人們對經(jīng)典人工智能中主要開放問題的注意力。

這些問題包括將意義和推理納入處理自然語言的系統(tǒng)中,推斷、反映和解釋因果關(guān)系,建立計算上可追蹤的不確定性表示以及建立長期目標設(shè)定框架。這些都是人類模仿人工智能的經(jīng)典目標,但它們很容易被忘卻,在最近“人工智能革命”的爭論中,這些目標還沒有得到解決。

人工智能也將持續(xù)保持其重要的地位,在可見的將來,機器在現(xiàn)實環(huán)境進行抽象思考的能力上仍無法與人類相媲美。為了解決我們最緊迫的問題,人機交互值得重點關(guān)注。我們希望計算機能激活人類創(chuàng)造力,而不是取代人類的創(chuàng)造力。

約翰·麥卡錫(當時擔任達特茅斯大學(xué)的教授,即將在麻省理工學(xué)院進修)發(fā)明了“人工智能”這個詞,他顯然是為了把新研究方向與諾伯特·維納(麻省理工學(xué)院的一位更老的教授)的研究方向區(qū)分開來。

維納發(fā)明了“控制論”來指代其智能系統(tǒng)概念——這個概念與運籌學(xué)、統(tǒng)計學(xué)、模式識別、知識理論和控制理論密切相關(guān)。另一方面,麥卡錫強調(diào)了控制論與理性的聯(lián)系。奇怪的是,在麥卡錫術(shù)語體系下,維納的智能體系在現(xiàn)代占據(jù)了主導(dǎo)地位。這當然只是暫時的,AI行業(yè)的變動比一般行業(yè)劇烈得多。

但我們需要進一步發(fā)展麥卡錫和維納的歷史觀點。值得注意的是,現(xiàn)有的公共人工智能對話僅僅關(guān)注了行業(yè)和學(xué)術(shù)界的一小部分,這可能會讓大眾忽視人工智能、IA和II的全面覆蓋所帶來的威脅和機遇。

這種關(guān)注不是為了實現(xiàn)科幻小說或超人類機器的幻想,更多的是為了考慮和發(fā)展科技,因為科技在人們的日常生活中變得越來越常見和有力。此外,科技的理解和塑造需要來自各行各業(yè)的各種不同聲音,而不僅僅是技術(shù)協(xié)調(diào)者之間的對話。如果只關(guān)注模仿人類的人工智能,就會一葉障目。

盡管人工智能將持續(xù)推動各方面的進步,學(xué)術(shù)界也將繼續(xù)扮演重要的角色——不僅提供最具創(chuàng)意技術(shù)的一些想法,而且也引入計算和統(tǒng)計學(xué)科的研究人員和其他學(xué)科的研究人員的成果和觀點,特別是社會科學(xué)、人文科學(xué)和認知科學(xué)。

另一方面,雖然人文和科學(xué)在歷史前進的過程中很重要,但也必須承認這是一個規(guī)模和范圍巨大的工程項目——社會尋求創(chuàng)造新的種類的對象。這些工件應(yīng)該按照規(guī)定的方式設(shè)計。

我們不想創(chuàng)造一個無用的項目來提供醫(yī)療保健、交通選擇和商業(yè)機會。在這一方面,正如上文所強調(diào)的,以數(shù)據(jù)和以學(xué)習(xí)為中心的領(lǐng)域還沒有成為一門工程學(xué)科。盡管這些領(lǐng)域非常吸引人,但它們還不能被視為工程學(xué)的一個分支。

此外,值得高興的是,我們正在目睹一個新工程學(xué)科的出現(xiàn)。通常來說,科技一詞在學(xué)術(shù)界和學(xué)術(shù)界以外的地方是狹義的,給人冷冰冰的機器印象和人類失去權(quán)力的負面暗示。因而我們想構(gòu)建一門新的工程學(xué)科,現(xiàn)在我們有一個絕佳機會來構(gòu)想一些異于傳統(tǒng)的新事物——以人為中心的工程學(xué)科。

如果未來仍然持續(xù)使用AI這一縮寫,人們必須要注意到其真正局限性。

THEEND

最新評論(評論僅代表用戶觀點)

更多
暫無評論