重磅 | 南棲仙策發(fā)布強化學(xué)習(xí)工業(yè)決策軟件REVIVE 1.0

信息化觀察網(wǎng)
小觀
然而,強化學(xué)習(xí)技術(shù)在實際工業(yè)環(huán)境中面臨著一些挑戰(zhàn),如時間慢、成本高和安全性問題。為了解決上述問題,南棲仙策開發(fā)了一款基于數(shù)據(jù)驅(qū)動的強化學(xué)習(xí)工具包REVIVE。這是一款面向工業(yè)場景中的決策任務(wù)的軟件,旨在幫助企業(yè)優(yōu)化工業(yè)生產(chǎn)效率、減少錯誤,降低成本,推動工業(yè)向智能化和可持續(xù)發(fā)展方向邁進。

導(dǎo)讀:

在工業(yè)場景中,有很多需要做決策的任務(wù),比如工業(yè)機器人控制、物流交通調(diào)度、化工生產(chǎn)和能源管理等。在這些決策場景中,好的控制策略可以幫助我們優(yōu)化工業(yè)生產(chǎn)效率、減少錯誤,降低成本,推動工業(yè)向智能化和可持續(xù)發(fā)展方向邁進。當前以深度強化學(xué)習(xí)為代表的智能決策技術(shù)已經(jīng)能夠在圍棋,游戲等場景中戰(zhàn)勝頂尖的人類專家。然而,強化學(xué)習(xí)技術(shù)在實際工業(yè)環(huán)境中面臨著一些挑戰(zhàn),如時間慢、成本高和安全性問題。

為了解決上述問題,南棲仙策開發(fā)了一款基于數(shù)據(jù)驅(qū)動的強化學(xué)習(xí)工具包REVIVE。這是一款面向工業(yè)場景中的決策任務(wù)的軟件,旨在幫助企業(yè)優(yōu)化工業(yè)生產(chǎn)效率、減少錯誤,降低成本,推動工業(yè)向智能化和可持續(xù)發(fā)展方向邁進。

640.webp.jpg

自2021年正式對外發(fā)布0.5版本以來,REVIVE已經(jīng)完成了0.6-0.9版本的更新,每次更新都會帶來新的特性,使得REVIVE的效果更好,使用起來更方便。今天為大家?guī)淼氖荝EVIVE的最新版本:REVIVE 1.0。

640.webp (1).jpg

REVIVE 1.0通過算法調(diào)優(yōu)升級,使得訓(xùn)練得到的算法更好更穩(wěn)定,同時集成了豐富的內(nèi)置函數(shù)和自定義模塊,使用起來更加靈活方便,通過代碼優(yōu)化和資源并行加速使得模型訓(xùn)練更快。

640.webp (2).jpg

640.webp (3).jpg

現(xiàn)代工業(yè)系統(tǒng)通常涉及多個生產(chǎn)過程,包括原材料處理、加工、裝配和包裝等。這些系統(tǒng)通常包括多個層次和子系統(tǒng),涉及各種不同的工藝、設(shè)備和控制系統(tǒng)。復(fù)雜的系統(tǒng)具有大量的輸入和輸出變量,而且這些變量之間的關(guān)系可能相互交織、不明確或非線性,這給決策任務(wù)的建模和優(yōu)化帶來了非常大挑戰(zhàn)。

所以REVIVE 1.0增加了注意力機制的Backbone,這一機制使得在缺乏專家知識的情況下,模型也能夠通過調(diào)整注意力權(quán)重自適應(yīng)的捕捉數(shù)據(jù)之間的關(guān)系,實現(xiàn)對復(fù)雜工藝控制和系統(tǒng)的有效建模。

640.webp (4).jpg

此外,針對時延問題,REVIVE 1.0也對原有的RNN Backbone進行了優(yōu)化,模型能夠更高效地提取和傳遞時序信息,顯著提升在管網(wǎng)控制、化工過程等長流程和大時滯任務(wù)場景上的性能。

64011.webp.jpg

同時,REVIVE 1.0增加了神經(jīng)網(wǎng)絡(luò)干擾器單模塊,通過多個神經(jīng)網(wǎng)絡(luò)干擾器對訓(xùn)練得到的環(huán)境模型進行擾動,增強環(huán)境模型的多樣性,提升策略適應(yīng)不同工況的泛化性能。

64012.webp.jpg

我們相信,REVIVE 1.0將為工業(yè)企業(yè)提供一種全新的決策方式,幫助企業(yè)在工業(yè)生產(chǎn)中實現(xiàn)智能化升級。

THEEND

最新評論(評論僅代表用戶觀點)

更多
暫無評論