天網(wǎng)又近了一步?美國(guó) AI 戰(zhàn)機(jī)擊敗人類(lèi)空軍飛行員

擺攤賣(mài)報(bào)紙
他們的 AI 空戰(zhàn)模型通過(guò)模擬訓(xùn)練,已經(jīng)積累了相當(dāng)于一名人類(lèi)飛行員 30 年的飛行經(jīng)驗(yàn)。該公司沒(méi)有透露太多關(guān)于其強(qiáng)化學(xué)習(xí)算法的信息,但表示 Falco 是使用其開(kāi)源的 AdeptRL 框架進(jìn)行訓(xùn)練的。

據(jù)英國(guó)科技媒體 The Register 報(bào)道,近日,美國(guó)軍事研究部門(mén) DARPA 舉辦了一場(chǎng)人工智能 VS 人類(lèi)的 “模擬空戰(zhàn)比賽”,該比賽借助美國(guó)空軍使用的飛行模擬器進(jìn)行。最終,一個(gè)被稱為 Falco 的人工智能戰(zhàn)斗機(jī)在一系列虛擬空戰(zhàn)中擊敗了一名戰(zhàn)場(chǎng)經(jīng)驗(yàn)豐富的美國(guó)空軍教官。

該比賽采用 1V1 的對(duì)戰(zhàn)模式,每位玩家坐在一架由計(jì)算機(jī)生成的 F-16 軍用戰(zhàn)斗機(jī)內(nèi),通過(guò)射擊子彈來(lái)消耗對(duì)方的健康條,同時(shí)避免自身受到傷害。在這場(chǎng)比賽中,先是由不同公司或研究機(jī)構(gòu)打造的 8 種不同的機(jī)器學(xué)習(xí)算法進(jìn)行相互對(duì)決,排名第一的勝者將與一名資深人類(lèi)戰(zhàn)斗機(jī)飛行員進(jìn)行人機(jī)互搏。最終,來(lái)自加州的美國(guó)國(guó)防供應(yīng)商 Heron Systems 團(tuán)隊(duì)旗下的 AI 戰(zhàn)機(jī) Falco 脫穎而出,獲得了與人類(lèi)對(duì)戰(zhàn)的機(jī)會(huì)。

代表人類(lèi)作戰(zhàn)的戰(zhàn)斗機(jī)飛行員是一名綽號(hào)為 "Banger" 的美國(guó)空軍教官,他擁有多年的實(shí)戰(zhàn)經(jīng)驗(yàn)。而被稱為 Falco 的 AI 戰(zhàn)機(jī)采用了深度強(qiáng)化學(xué)習(xí)代理,并采取了非常積極主動(dòng)的作戰(zhàn)策略,被視為一個(gè)恐怖的對(duì)手。不幸的是,代表人類(lèi)出戰(zhàn)的 Banger 在面對(duì) AI 時(shí)幾乎毫無(wú)招架之力。盡管 Banger 借助自己豐富的空戰(zhàn)經(jīng)驗(yàn)頑強(qiáng)抵御,但最終仍然以 0-5 的比分完敗于 Falco 。

DARPA 方面表示,雖然這場(chǎng)比賽的結(jié)果或許會(huì)引發(fā)一些擔(dān)憂,但暫時(shí)還不用擔(dān)心現(xiàn)實(shí)中會(huì)出現(xiàn)像這樣輕松碾壓人類(lèi)的殺手級(jí) AI 無(wú)人機(jī),因?yàn)楝F(xiàn)階段的這種模擬對(duì)戰(zhàn)仍然太過(guò)簡(jiǎn)單,與真實(shí)戰(zhàn)爭(zhēng)中的戰(zhàn)斗場(chǎng)景相比相差甚遠(yuǎn)。

ACE 項(xiàng)目經(jīng)理 Dan Javorsek 中校表示,“只有在 AI 算法能夠像人類(lèi)飛行員一樣在戰(zhàn)斗過(guò)程中做出預(yù)測(cè)、臨場(chǎng)應(yīng)變等策略性處理,模擬空中交戰(zhàn)場(chǎng)景的難度和真實(shí)性才會(huì)增加。”

Heron Systems 公司則表示,他們的 AI 空戰(zhàn)模型通過(guò)模擬訓(xùn)練,已經(jīng)積累了相當(dāng)于一名人類(lèi)飛行員 30 年的飛行經(jīng)驗(yàn)。該公司沒(méi)有透露太多關(guān)于其強(qiáng)化學(xué)習(xí)算法的信息,但表示 Falco 是使用其開(kāi)源的 AdeptRL 框架進(jìn)行訓(xùn)練的。

Falco 采用的 AdeptRL 是一個(gè)開(kāi)源的強(qiáng)化學(xué)習(xí)框架,旨在通過(guò)抽象化與深度強(qiáng)化學(xué)習(xí)相關(guān)的工程挑戰(zhàn)來(lái)加速研究。該框架支持單個(gè)或多 GPU 訓(xùn)練,采用 PyTorch 的基線強(qiáng)化學(xué)習(xí)模型和算法,處理性能達(dá)到 3000 steps/s,12000 FPS(Atari)。同時(shí)使用自定義網(wǎng)絡(luò)、代理和環(huán)境的模塊化界面,內(nèi)置張量板日志記錄,具有模型保存、重新加載、評(píng)估和渲染功能。

一名 Heron Systems 的工程師透露,接下來(lái)他們將嘗試在真實(shí)的無(wú)人機(jī)上搭載 Falco 進(jìn)行測(cè)試。

美國(guó)軍事研究部門(mén) DARPA 在去年 9 月提出的空中戰(zhàn)斗進(jìn)化 “ACE 計(jì)劃” 旨在創(chuàng)造能夠在沒(méi)有人類(lèi)飛行員幫助的情況下進(jìn)行空戰(zhàn)的軍用飛機(jī)。不過(guò),就像車(chē)輛不會(huì)完全無(wú)人駕駛一樣,DARPA 更感興趣的是打造能夠輔助人類(lèi)飛行員進(jìn)行戰(zhàn)斗的人工智能。官方表示,該計(jì)劃的最終目標(biāo)是打造由 AI 控制的自動(dòng)噴氣式戰(zhàn)斗裝置,能夠以閃電般的速度處理諸如躲開(kāi)敵人火力等實(shí)時(shí)操作,而飛行員則承擔(dān)一些更復(fù)雜的策略性任務(wù),比如執(zhí)行戰(zhàn)略戰(zhàn)斗指令和發(fā)射導(dǎo)彈等。

“我們?cè)O(shè)想的未來(lái)是,AI 能夠處理視距內(nèi)犬牙交錯(cuò)的戰(zhàn)斗中分秒必爭(zhēng)的快速機(jī)動(dòng),當(dāng)飛行員將大量無(wú)人系統(tǒng)編排成一張具有壓倒性效果的戰(zhàn)斗網(wǎng)時(shí),就能保持飛行員本身更安全,攻擊更有效。” ACE 項(xiàng)目經(jīng)理 Dan Javorsek 中校說(shuō),“ACE 的目標(biāo)是開(kāi)發(fā)能夠自動(dòng)駕駛飛機(jī)的算法,同時(shí)人類(lèi)飛行員在戰(zhàn)斗中專(zhuān)注于更復(fù)雜的戰(zhàn)略功能,而不是簡(jiǎn)單地用機(jī)器取代軍隊(duì)。”

THEEND

最新評(píng)論(評(píng)論僅代表用戶觀點(diǎn))

更多
暫無(wú)評(píng)論