金融行業(yè)如何提高GPU資源利用效能,加速AI智能化應用?

隨著金融行業(yè)的蓬勃發(fā)展,客戶數(shù)量快速增長,金融行業(yè)涉及的業(yè)務領域不斷拓展。在此背景下,AI技術在金融公司的各類交易、業(yè)務處理、客戶服務等眾多場景中將得到更加廣泛深入的應用,比如量化交易、極速交易、精準推薦、人臉識別、視頻質檢、智能客服等等。

本文來自微信公眾號“twt企業(yè)IT社區(qū)”。

隨著金融行業(yè)的蓬勃發(fā)展,客戶數(shù)量快速增長,金融行業(yè)涉及的業(yè)務領域不斷拓展。在此背景下,AI技術在金融公司的各類交易、業(yè)務處理、客戶服務等眾多場景中將得到更加廣泛深入的應用,比如量化交易、極速交易、精準推薦、人臉識別、視頻質檢、智能客服等等。

大語言模型是自然語言處理的最高階階段,機器能夠聽懂人的命令、遵循人的價值觀。能夠生成自然語言的人工智能模型。類ChatGPT大語言模型的出現(xiàn),也催生了金融行業(yè)對大語言模型應用的需求。然而無論從大語言模型的數(shù)據(jù)處理,模型優(yōu)化還是到高算力需求,都給金融AI帶來大語言模型落地帶來巨大挑戰(zhàn)。

社區(qū)近期組織了“邁入ChatGPT大語言模型時代,金融行業(yè)如何提高GPU資源利用效能加速AI智能化應用?”主題探討,邀請金融行業(yè)AI專家與社區(qū)會員共同交流,希望能夠為金融行業(yè)同行迎接ChatGPT大語言模型時代的挑戰(zhàn)和機遇提供幫助。以下是此次活動的交流精華內容整理,供大家參考。

交流取得的共識

1、金融企業(yè)落地大語言模型會遇到潛在問題:一是數(shù)據(jù)隱私問題、二是模型魯棒性問題、三是模型可解釋性問題、四是資源成本問題、五是可信度問題。

2、大語言模型由于模型體量大,對GPU顯存要求高到一定程度的情況下,需要多機并行訓練。在預算許可的情況下,可以采購高帶寬的路由器。如果預算有限,可以試用類似NVIDIA AI Enterprise軟件套件中NeMo的訓練框架,通過框架提供的優(yōu)化功能進行提速,這樣可以減少網(wǎng)絡對AI訓練的影響。

3、ChatGPT在金融行業(yè)的主要應用場景:金融客戶服務、投資決策、風險管理、智能客服應用、數(shù)據(jù)分析和預測等等主流金融應用場景。

4、引入大模型之后,AI平臺可以通過增加GPU數(shù)量、升級硬件設備包括存儲、網(wǎng)絡配置、優(yōu)化算法模型、優(yōu)化計算資源調度算法等方式提升算力。

1、在ChatGPT大語言模型時代,金融行業(yè)如何做好數(shù)據(jù)安全和隱私保護?

【問題描述】金融行業(yè)處理的數(shù)據(jù)往往是敏感性較高的個人和公司財務數(shù)據(jù),需要嚴格保護。那么,在GPU選型上,或使用GPU資源上,有什么選型策略,什么技術手段、什么措施等來確保數(shù)據(jù)的安全性和隱私保護?

 daliu某金融機構系統(tǒng)架構師:

在ChatGPT大語言模型時代,金融行業(yè)可以采用以下方式保證數(shù)據(jù)安全:

1)數(shù)據(jù)加密:使用加密技術對客戶數(shù)據(jù)進行加密,以保護數(shù)據(jù)的機密性、完整性和可用性。

2)數(shù)據(jù)脫敏:對于涉及到客戶隱私的數(shù)據(jù),如姓名、地址、身份證號碼等,需要進行脫敏處理,以保護客戶的隱私。

3)訪問控制:建立嚴格的訪問控制機制,只允許授權人員訪問數(shù)據(jù),可以采用基于角色的訪問控制、基于策略的訪問控制等方式來實現(xiàn)訪問控制。

4)監(jiān)控和報警:建立數(shù)據(jù)監(jiān)控和報警機制,及時發(fā)現(xiàn)和處理數(shù)據(jù)安全事件。

5)數(shù)據(jù)安全意識培訓:對員工進行數(shù)據(jù)安全和隱私保護的培訓和教育,提高員工的安全意識和保護客戶信息的責任感。

GPU選型影響的是計算效率,跟數(shù)據(jù)安全沒太大關系。

 dengjf99某股份制銀行軟件開發(fā)工程師:

數(shù)據(jù)隱私與GPU選型沒有必然聯(lián)系,具體保護方式要看模型部署方式、使用的訓練語料、用戶輸入指令的方式等。

譬如,最保險的方法是行內私有化部署,只開放給內部用戶使用;如果是開放給外部用戶使用,則不能使用行內敏感數(shù)據(jù)和涉密文檔做訓練;如果是外部部署,則用戶輸入指令及數(shù)據(jù)要做一些控制和審核。

 zftang:

使用ChatGPT時,您應該注意以下幾點:

1)提供最少的信息:在使用ChatGPT時,您應該盡可能提供最少的信息。例如,在問答系統(tǒng)中,您只需提供問題的關鍵詞即可獲得答案,而不需要提供詳細的個人信息。

2)注意聊天記錄:ChatGPT會記錄您的聊天記錄,因此您應該注意保護自己的聊天內容。避免透露敏感信息和個人信息,尤其是在與陌生人聊天時。

3)使用安全的網(wǎng)絡連接:確保您使用的網(wǎng)絡連接是安全的,可以使用密碼保護和加密技術來保護您的數(shù)據(jù)。

2、金融企業(yè)落地大語言模型有什么潛在問題?

【問題描述】金融企業(yè)落地大語言模型需要大量硬件投資成本嗎?一般喜歡采購現(xiàn)有模型來調優(yōu),這樣有什么需要潛在注意的?引入大模型對合規(guī)風控以及監(jiān)管這一塊有什么影響?

 朱向東中原銀行高級工程師:

說到潛在問題,個人理解可能有以下幾個方面的問題吧。

一是數(shù)據(jù)隱私問題:大語言模型需要大量的數(shù)據(jù)來訓練和優(yōu)化模型,但是金融企業(yè)處理的數(shù)據(jù)通常包含大量的隱私信息,如個人身份信息、信用卡信息、財務信息等。如果這些數(shù)據(jù)不加保護地被用于訓練模型,可能會泄露客戶隱私,引起法律問題和公眾關注。

二是模型魯棒性問題:大語言模型往往需要大量的計算資源來進行訓練和推理,而金融企業(yè)的業(yè)務場景往往非常復雜,需要高度準確的模型來進行預測和決策。如果模型的魯棒性不夠,可能會導致誤判或誤判率過高的問題。

三是模型可解釋性問題:大語言模型的模型結構和運算過程非常復雜,往往難以解釋模型的預測和決策過程。而金融企業(yè)需要對模型的預測和決策過程進行解釋,以滿足監(jiān)管要求和客戶需求。

四是資源成本問題:大語言模型需要大量的計算資源和存儲資源來運行和維護,而金融企業(yè)的業(yè)務場景往往需要高度準確的預測和決策,需要大量的計算和存儲資源來支持。這可能會導致高昂的資源成本,影響企業(yè)的盈利能力,但這并不一定是必然的,具體情況視企業(yè)的需求和預算而定。

五是可信度問題:大語言模型的可信度需要得到保障,否則可能會導致誤判或誤判率過高的問題。金融企業(yè)需要對模型的可信度進行充分的測試和驗證,以保證模型的準確性和穩(wěn)定性。

 dengjf99某股份制銀行軟件開發(fā)工程師:

大模型的硬件投資成本是比一般人工智能模型高不少的,具體視乎用到大模型的參數(shù)量級和部署實例的多少。

在合規(guī)監(jiān)管方面國家網(wǎng)信辦發(fā)布了《生成式人工智能服務管理辦法(征求意見稿)》,可以參考。

 daliu某金融機構系統(tǒng)架構師:

落地大模型肯定是需要投入大量的硬件成本的,而且現(xiàn)有的硬件可能不能滿足大模型資源配置需求,另外現(xiàn)有的模型可能已經過時或者不能滿足金融企業(yè)的需求,因此需要采購新的大語言模型進行調優(yōu)。

對于合規(guī)風控以及監(jiān)管這塊,除了上述回答的模型可靠性和數(shù)據(jù)安全問題外,還可能由于ChatGPT技術的引入帶來業(yè)務流程變化,從而對傳統(tǒng)的合規(guī)和監(jiān)管制度帶來挑戰(zhàn)。

 waring_id美宜佳系統(tǒng)架構師:

大語言模型可以理解為通用人工智能(Artificial general inteligence)的一種。是指能夠像人類一樣在各種不同的任務和情緒中自主學習和應用知識的人工智能系統(tǒng),它和解決特定問題或任務的不一樣,AGI具備更廣泛的適應性和靈活性,能自主學習、推理、解決問題、感知、理解語言等。

1)大語言模型涉及的計算量非常大,考慮數(shù)據(jù)自主性和安全隱私,這類算法必須要是自主或能被監(jiān)管的前提下部署。該系統(tǒng)涉及的硬件規(guī)模大,對應的投資成本相應也大(同時還需要考慮中美貿易戰(zhàn)對高端計算芯片限制導致的周期和缺貨風險)

2)數(shù)據(jù)隱私和監(jiān)管控制以及輿論的導向都是需要重點考慮的內容

3)自主學習后系統(tǒng)呈現(xiàn)的智能決策和輸出結果需要經過驗證,通過什么樣的方式或流程實現(xiàn)評估也是需要考慮

4)極端情況下系統(tǒng)自主學習后發(fā)展出自動對抗合規(guī)監(jiān)管的情況如何發(fā)現(xiàn)及避免。

3、chatgpt在金融行業(yè)的應用場景如何保障數(shù)據(jù)安全?

 dengjf99某股份制銀行軟件開發(fā)工程師:

最保險的方法是行內私有化部署,只開放給內部用戶使用;如果是開放給外部用戶使用,則不能使用行內敏感數(shù)據(jù)和涉密文檔做訓練;如果是外部部署,則用戶輸入指令及數(shù)據(jù)要做一些控制和審核。

 wzpystcdc研發(fā)工程師:

1)充分保護個人用戶數(shù)據(jù)和敏感數(shù)據(jù),對預計使用的輸入數(shù)據(jù)進行敏感性識別,限制敏感數(shù)據(jù)的輸入,或利用脫敏數(shù)據(jù)使用ChatGPT。

2)建立企業(yè)用戶訪問控制機制,防止未授權使用ChatGPT,導致數(shù)據(jù)泄露。

3)對企業(yè)員工進行如何正確使用ChatGPT培訓,定期進行安全監(jiān)測和合規(guī)審計。

4、如何減少網(wǎng)絡對AI訓練的影響?

【問題描述】邁入ChatGPT大語言模型時代,金融行業(yè)提高GPU資源利用效能加速AI智能化應用,如何減少網(wǎng)絡對AI訓練的影響?

 Cui Xiaonan NVIDIA英偉達DevRel:

可以從訓練框架入手,通過不同并行訓練方式,可以達到部分網(wǎng)絡優(yōu)化,建議了解英偉達的訓練框架,NVIDIA AI Enterprise軟件套件中的NeMo Framework專門針對大語言模型的分布式訓練框架。

 daliu某金融機構系統(tǒng)架構師:

可以從以下方面著手:

1)優(yōu)化數(shù)據(jù)傳輸:優(yōu)化數(shù)據(jù)傳輸方式,采用更加高效的數(shù)據(jù)傳輸協(xié)議和方式,以減少網(wǎng)絡帶寬的消耗,提高訓練效率。

2)采用更加高效的模型:對于計算密集型任務,采用更加高效的模型,如基于深度學習的GPU加速模型,以減少訓練時間和計算量。

3)減少數(shù)據(jù)的傳輸量:對于數(shù)據(jù)量較大的任務,通過減少數(shù)據(jù)的傳輸量來減少網(wǎng)絡帶寬的消耗,提高訓練效率。如壓縮數(shù)據(jù)、減少數(shù)據(jù)的維度等方式來實現(xiàn)。

4)優(yōu)化模型結構:可以通過優(yōu)化模型結構來減少訓練時間和計算量??梢酝ㄟ^調整網(wǎng)絡結構等方式來實現(xiàn)

 dengjf99某股份制銀行軟件開發(fā)工程師:

大語言模型由于模型體量大,對GPU顯存要求高到一定程度的情況下,需要多機并行訓練。在預算許可的情況下,可以采購高帶寬的路由器。如果預算有限,可以試用類似NVIDIA AI Enterprise軟件套件中的NeMo訓練框架,通過框架提供的優(yōu)化功能進行提速。

 朱向東中原銀行高級工程師:

這是個好問題,提到減少網(wǎng)絡對AI訓練的影響,想必你所在AI環(huán)境的規(guī)模已經不小了,單機或較小規(guī)模場景下,一般都不會考慮到網(wǎng)絡對AI環(huán)境的影響,其實,AI環(huán)境對網(wǎng)絡的依賴程度是非常高的,成規(guī)?;渴饡r必須要提前規(guī)劃好AI環(huán)境的網(wǎng)絡架構,如存儲網(wǎng)絡區(qū)、訓練網(wǎng)絡區(qū)、推理網(wǎng)絡區(qū)、業(yè)務網(wǎng)絡區(qū)等。

那么,如何減少網(wǎng)絡對AI訓練的影響,大概可以從以下幾個方面著手:

1)在訓練模型前,對數(shù)據(jù)進行預處理,減少數(shù)據(jù)在網(wǎng)絡上的傳輸量。

2)將模型分散到多臺服務器上,減少每臺服務器之間相互交互的網(wǎng)絡負載。

3)適當考慮增大服務器本地磁盤,將數(shù)據(jù)緩存到服務器本地硬盤上,避免每次訓練都從網(wǎng)絡上傳輸數(shù)據(jù)。

4)審視當前網(wǎng)絡結構,減少網(wǎng)絡層數(shù),減少不必要的網(wǎng)絡設備,減少網(wǎng)絡之間的傳輸負載。

5)選用合適的模型,減少模型的大小和參數(shù)量,盡量降低網(wǎng)絡傳輸?shù)呢撦d。

6)考慮使用專用AI硬件設備來提高訓練效率,同時降低網(wǎng)絡傳輸負載。

7)重新審視所選的訓練工具,評估其網(wǎng)絡傳輸負載對網(wǎng)絡環(huán)境的影響。

綜合來說,要結合實際需求情況和自身的網(wǎng)絡現(xiàn)狀及AI訓練環(huán)境的現(xiàn)狀去考慮整體的解決方案。

5、針對人機交互場景有沒有比較好的思路,如何通過人工智能來為客戶提供優(yōu)質的金融服務?

【問題描述】ChatGPT大語言模型需要與用戶進行有效的交互,而金融行業(yè)的用戶通常是非專業(yè)人士,對金融術語和概念不熟悉,需要進行有效的人機交互設計,以提高用戶的體驗和滿意度,請各位專家分享一些金融行業(yè)在ChatGPT時代下人機交互場景方面的好思路和創(chuàng)意。

 daliu某金融機構系統(tǒng)架構師:

在金融行業(yè)中,人機交互場景的設計需要考慮到用戶的需求和體驗,可以考慮以下幾個場景:

1)智能客服場景:利用AI技術,包括NLP、語音識別、機器翻譯等,打造智能客服系統(tǒng)、智能語音助手或聊天機器人等,來解答用戶的問題和咨詢,為客戶提供更加高效、便捷的服務體驗。

2)智能投顧場景:通過深度學習算法,為客戶提供個性化的投資建議和服務,包括基金選擇、投資組合管理等方面,提高投資收益率和風險控制能力。

3)自助銀行場景:人工智能技術可以通過智能柜員機、智能ATM機等設備,為客戶提供更加便捷的自助服務體驗,包括賬戶查詢、轉賬、購買理財?shù)确矫妗?/p>

4)智能風控場景:通過大數(shù)據(jù)分析和AI技術,對客戶的信用評估、風險評估等方面進行智能化處理,提高金融機構的風險控制能力。

5)市場調研場景:金融機構需要了解客戶、市場和同業(yè)等信息,ChatGPT可以進行問卷調查以收集信息,然后分析該數(shù)據(jù)以生成對銀行家做出決策有用的反饋。通過分析文本語言,ChatGPT能夠幫助經營機構迅速了解市場輿情、競品動態(tài)、客戶需求等。

以上場景部分已有落地案例,AIGC技術的發(fā)展,勢必會加快金融行業(yè)數(shù)智化進程。

 dengjf99某股份制銀行軟件開發(fā)工程師:

在銀行APP中,已經上線了智能客服機器人,進行非人工的自動交互。很多機器人背后的問題相似匹配等都已經使用了NLP技術,答案搜索也是用了一些基于知識圖譜技術的知識庫。但是由于在客戶交互人性化、問題多樣性方面的要求,整體效果還不是很好。

借助ChatGPT高質量的對話功能,可以更新智能客服機器人的設計方式、答復質量和客戶體驗。

6、如何高效的GPU資源復用?

【問題描述】非訓練場景下,測試環(huán)境如果只有少量的GPU卡,該如何進行GPU資源的復用(包括算力與顯存)?

 Cui Xiaonan NVIDIA英偉達DevRel:

NVIDIA AI Enterprise軟件套件中vGPU和Operator插件在hypervisor和k8s平臺均可以實現(xiàn)GPU的切分和多卡復用的能力,具體可以參考Overview—NVIDIA Cloud Native Technologies documentation目前這兩個組件都已經包含到NVAIE軟件套件中。

 dengjf99某股份制銀行軟件開發(fā)工程師:

在模型推理的場景,如果沒有GPU管理功能的K8S云平臺支持,一個模型實例需要占用一張GPU卡。為了提高并行度,我們的經驗是使用NVIDIA AI Enterprise軟件套件中的Triton技術來實現(xiàn)一卡多實例的模型部署。

7、GPU資源容器化,在底層的GPU框架上需要做哪些改變?業(yè)務開發(fā)要注意哪些?

 Cui Xiaonan NVIDIA英偉達DevRel:

GPU資源的容器化,可以更高效更快速更自動化實現(xiàn)環(huán)境置備和部署,對于其中需要的資源準備部分,會通過kubernetes的插件或Operator的方式去實現(xiàn),建議客戶參考英偉達提供原生開源的GPU Operator,英偉達發(fā)布的原生插件對于GPU的驅動及其兼容的CUDA版本有最好的兼容和適配性,不建議采用第三方通過CUDA攔截方式的插件,CUDA攔截的插件對于CUDA版本具有很強的依賴性,對于應用的適配和環(huán)境準備的限制都非常大,同時英偉達不提供CUDA攔截方式的技術支持。

官方GPU Operator的鏈接:Overview—NVIDIA Cloud Native Technologies documentation。

8、目前金融機構建設的大數(shù)據(jù)平臺如何適配或應用大語言模型數(shù)據(jù)處理?

 daliu某金融機構系統(tǒng)架構師:

可以采取以下幾種方法:

1)預處理數(shù)據(jù):對于大語言模型數(shù)據(jù),需要進行預處理,包括分詞、詞性標注、命名實體識別等。通過這些處理,可以將大語言模型數(shù)據(jù)轉換為更容易處理的形式,提高數(shù)據(jù)處理效率。

2)使用大數(shù)據(jù)平臺的高性能計算能力:大數(shù)據(jù)平臺通常具有高性能計算能力,可以利用這些能力來加速數(shù)據(jù)處理過程。例如,可以使用大數(shù)據(jù)平臺的MapReduce框架來進行分布式計算,從而提高數(shù)據(jù)處理速度。

3)優(yōu)化數(shù)據(jù)存儲:大數(shù)據(jù)平臺通常使用列式存儲系統(tǒng)來存儲數(shù)據(jù)。為了適配大語言模型數(shù)據(jù)處理,可以考慮使用更高效的數(shù)據(jù)存儲方式,例如,使用閃存來代替?zhèn)鹘y(tǒng)的硬盤。

4)開發(fā)定制化模型:如果需要更精確和靈活的數(shù)據(jù)處理方式,可以考慮開發(fā)定制化模型。例如,可以使用基于預訓練模型的自定義模型來進行數(shù)據(jù)處理。

 朱向東中原銀行高級工程師:

首先,大語言模型數(shù)據(jù)處理是利用深度學習技術和自然語言處理技術對文本數(shù)據(jù)進行處理和分析的方法。通過大語言模型數(shù)據(jù)處理可以對大量的文本數(shù)據(jù)進行分析和挖掘,發(fā)現(xiàn)隱藏在數(shù)據(jù)背后的規(guī)律和趨勢,為決策提供支持。那么,在金融領域,利用大語言模型數(shù)據(jù)處理可以對金融市場數(shù)據(jù)進行分析和預測,對風險進行評估和控制,提高投資決策的準確性和效率;

對于金融機構建設的大數(shù)據(jù)平臺可以適配或應用大語言模型數(shù)據(jù)處理,個人理解理論上大概有以下內容吧:

1)數(shù)據(jù)的采集方面,通過各種渠道采集數(shù)據(jù),包括結構化數(shù)據(jù)和非結構化數(shù)據(jù),例如交易記錄、用戶行為數(shù)據(jù)、新聞報道等。

2)數(shù)據(jù)的清洗方面,需要對采集到的數(shù)據(jù)進行清洗和去重,確保數(shù)據(jù)的質量和準確性。

3)數(shù)據(jù)的存儲方面,需要將清洗后的數(shù)據(jù)存儲到大數(shù)據(jù)平臺中,例如Hadoop、Spark等。

4)數(shù)據(jù)的預處理方面,需對存儲在大數(shù)據(jù)平臺中的數(shù)據(jù)進行預處理,例如數(shù)據(jù)標準化、特征提取、數(shù)據(jù)歸一化、數(shù)據(jù)轉換、數(shù)據(jù)壓縮等。目的是提高數(shù)據(jù)質量和處理效率。

5)模型訓練方面,應用大語言模型對預處理后的數(shù)據(jù)進行模型訓練,例如深度學習模型、自然語言處理模型等。

6)模型評估方面,需要對訓練好的模型進行評估,包括模型的準確率、召回率等指標。

7)模型優(yōu)化方面,根據(jù)評估結果對模型進行優(yōu)化,提高模型的預測能力和效果。

8)模型應用方面,將優(yōu)化后的模型應用到金融業(yè)務中,例如風險控制、投資分析等。

9)可視化方面,需要對處理好的數(shù)據(jù)使用數(shù)據(jù)可視化工具將其呈現(xiàn)出來,實現(xiàn)更加精準和智能的數(shù)據(jù)分析和應用,提高金融機構的業(yè)務效率和決策能力以及客戶服務水平。

9、ChatGPT在金融行業(yè)的應用場景有哪些?

【問題描述】個人認為chatgpt在金融業(yè)落地的時間不會特別早,現(xiàn)在是在炒作概念時期,雖然已經有相關公司推出相應的產品,但是產品還有待完善。技術遲早會進行升級,產品也會越來越完善,基于以上出發(fā)點需要做出前期準備工作,我認為應用場景才是大家需要提前考慮的。

1)chatgpt的智能客服不會再被認為是人工智障

2)開發(fā)工具,代碼自動生成測試

3)數(shù)據(jù)處理,提取數(shù)據(jù)不需要技術人員,同時對安全性提出更高要求

4)前臺業(yè)務操作替代柜員

 HiMy招商系統(tǒng)分析師:

ChatGPT在金融行業(yè)的應用場景目前來看,主要包括但不限于以下幾個方面:

1)金融客戶服務:ChatGPT可被用于金融客戶服務中,幫助客戶解答常見問題和疑問,并提供相關金融產品的信息和服務。同時,ChatGPT還可用于識別客戶的需求并為其提供定制化的服務。

2)投資決策:ChatGPT可被用于分析金融市場數(shù)據(jù)、新聞和公告,并幫助投資人員作出決策。ChatGPT可被用于自然語言處理、文本分析和信息挖掘,幫助投資人員識別市場趨勢和機會,并提供有價值的建議。

3)風險管理:ChatGPT可被用于幫助金融機構進行風險管理和監(jiān)測,通過分析大量的數(shù)據(jù)和信息,發(fā)現(xiàn)潛在的風險和機會,并提供有效的風險管理策略和措施。

4)自動化客服:ChatGPT可被用于自動化客戶服務,通過識別客戶的問題和需求,為客戶提供定制化的服務。這種方式可以節(jié)省客服人員的時間和精力,提高客戶滿意度,并降低運營成本。

5)數(shù)據(jù)分析和預測:ChatGPT可被用于金融數(shù)據(jù)的分析和預測。通過分析金融市場數(shù)據(jù)和交易數(shù)據(jù),ChatGPT可以識別趨勢和模式,并預測未來的市場走勢和交易機會。

 朱向東中原銀行高級工程師:

除了你提到的金融領域的應用場景外,我個人理解ChatGPT技術在基于CallCenter和宣傳營銷等應用場景下,還有較多的擴展場景可以探索,比如:

1)智能客服應用,通過ChatGPT的自然語言處理技術實現(xiàn)自動回復和解決用戶問題,提高客戶滿意度和服務效率。

2)機器翻譯應用,通過ChatGPT可以將一種語言的文本翻譯成另一種語言的文本,減少語言障礙,提高跨國交流效率。

3)內容生成應用,可以通過ChatGPT生成文章、新聞、商品描述等內容,減少人工編寫的工作量,提高生產效率。

4)情感分析應用,通過分析文本中的情感色彩,了解用戶的情感狀態(tài)和需求,提高用戶體驗和產品質量。

5)個性化推薦應用,通過分析用戶的行為和偏好,推薦符合用戶需求的產品和服務,提高轉化率和用戶滿意度。

 daliu某金融機構系統(tǒng)架構師:

前面兩位回答挺到位了,其他就補充一些通用場景吧,比如:

1)辦公服務,類似嵌入office軟件或者一些能效工具,自動生成一些文檔模板、excel處理之類的,提高辦公效率

2)員工培訓,可以通過ChatGPT內容生成能力,為員工提供個性化的培訓方案和學習材料。

10、NVIDIA的PaaS層系統(tǒng)有沒有面向金融領域的可以介紹一下?

 Cui Xiaonan NVIDIA英偉達DevRel:

對于您提到的PaaS,譬如在數(shù)據(jù)處理方向,通過RAPIDS可以實現(xiàn)Spark的數(shù)據(jù)處理及查詢的加速,實現(xiàn)特征及ML模型的訓練和部署,特別是針對相關性分析的GNN(圖模型)也是在風險和欺詐鄰域比較前沿的應用,在模型訓練方面,結合預訓練的模型,可以借助TAO實現(xiàn)遷移學習和模型訓練的場景,針對AI應用的大規(guī)模部署,可通過NVIDIA AI Enterprise軟件套件中的Triton推理服務框架,實現(xiàn)生產級別的大規(guī)模推理服務的部署,譬如支持部署OCR等票據(jù)處理的應用。

11、GPU池化管理?

【問題描述】1、在沒有GPU的服務器上的容器,能否遠程調用GPU集群的GPU資源?2、物理GPU服務器上的應用如何安全地遷移至遲化的GPU集群(P2V)?3、ppt分享內容為產品理論介紹,是否有產品的可視化界面介紹,以及一個demo的使用說明介紹?

 Cui Xiaonan NVIDIA英偉達DevRel:

1)英偉達不提供遠程GPU調用的能力。

2)P2V的實現(xiàn)更多通過Hypervisor或K8s來實現(xiàn)。

3)NVAIE的軟件界面主要通過hypervisor和k8s平臺進行展現(xiàn),同時GPU的切分和聚合的能力,也會集成到環(huán)境制備的過程中。

12、引入大模型后,現(xiàn)有AI平臺應該如何優(yōu)化提升算力?

【問題描述】引入大模型后,AI平臺應該如何優(yōu)化提升算力,以及AI平臺架構對接數(shù)據(jù)中心現(xiàn)有架構對接需要有哪些改造?如何設置合理的GPU等資源用于大模型推理,如何控制資源使用避免潛在問題發(fā)生?部署大模型對AI平臺建設配置等有什么要求?引入大模型后期該如何調優(yōu),在金融行業(yè)應用中大模型的準確率,精度大概可以可以達到多少?引入大模型后,對于大模型的監(jiān)控該怎么弄,有什么可以參考的監(jiān)控指標嗎?

 daliu某金融機構系統(tǒng)架構師:

引入大模型之后,AI平臺可以通過增加GPU數(shù)量、升級硬件設備包括存儲、網(wǎng)絡配置、優(yōu)化算法模型、優(yōu)化計算資源調度算法等方式提升算力。

在設置合理的GPU等資源用于大模型推理時,需要注意以下幾點:

1)合理規(guī)劃GPU資源:根據(jù)數(shù)據(jù)中心的實際情況,合理規(guī)劃GPU資源,避免資源浪費和性能瓶頸。

2)監(jiān)控GPU使用情況:為了控制GPU資源的使用,需要監(jiān)控GPU使用情況,及時發(fā)現(xiàn)和解決潛在問題。

3)優(yōu)化GPU使用:根據(jù)大模型的特點和數(shù)據(jù)特征,優(yōu)化GPU使用,如避免過度訓練、調整模型參數(shù)等,以提高模型的準確率和效果。

部署大模型對AI平臺配置要求如下:

1)高性能計算機:部署大模型需要使用高性能計算機,推薦裸金屬服務器或高性能服務器。

2)大容量高性能存儲:為了存儲大模型的數(shù)據(jù)和模型,需要使用大容量高性能存儲設備,如SSD等。

3)高性能網(wǎng)絡:使用高速網(wǎng)絡設備,配置高性能網(wǎng)卡,使用高性能網(wǎng)絡協(xié)議等

對于大模型的監(jiān)控,可以參考以下監(jiān)控指標:

1)模型準確率:監(jiān)控模型的準確率、召回率等指標

2)計算效率:監(jiān)控模型的計算效率、GPU的利用率等指標

3)數(shù)據(jù)集大?。罕O(jiān)控數(shù)據(jù)集的大小、數(shù)據(jù)分布等指標

4)訓練時間:監(jiān)控訓練時間、模型參數(shù)更新頻率等指標

5)資源消耗:監(jiān)控資源消耗、計算和存儲消耗等指標

13、容器云平臺是否可以將GPU資源池化,類似CPU和內存資源一樣跨服務器去進行靈活的調度?

 daliu某金融機構系統(tǒng)架構師:

基本都可以,這個問題需要從容器云平臺的提供商來看,實現(xiàn)方式不太一樣,我們把提供商分成2類:

第一類就是頭部云廠商提供容器云平臺,基本都支持GPU資源池化,支持跨服務器進行靈活調度,同時支持單張卡的切分,即,多個pod可以共享一張卡,比如阿里云的cGPU,騰訊云的qGPU等;

第二類是規(guī)模較小的云廠商,采用k8s開源插件也能實現(xiàn)簡單的GPU資源池化,只要GPU服務器在一個集群,也能實現(xiàn)跨服務器調度,但是他們不支持單卡切分,除非使用NVIDIA AI Enterprise軟件套件中的vGPU技術或者引入第三方GPU池化方案。

14、大語言模型框架NVIDIA AI Enterprise軟件套件中的Nemo Framework在金融行業(yè)有哪些落地實踐?效果怎么樣?

 Monica Wang NVIDIA英偉達NVIDIA AI Enterprise產品經理:

目前NVIDIA AI Enterprise軟件套件中Nemo Framework EA版在被一些互聯(lián)網(wǎng)公司和金融科技公司試用,試用反饋都非常正向。

15、中小金融企業(yè)能否利用chatGPT進行彎道超車?

【問題描述】在傳統(tǒng)金融行業(yè),大中小型企業(yè)的分類比較簡單,投入基本可以決定了你在行業(yè)里的地位。對于中小金融企業(yè)來說,chatgpt是否算是給我們提供了一個彎道超車的機會?沒有大范圍的彈性資源池,沒有巨額的IT投入,把有限的人力投入到類chatgpt應用的開發(fā)和業(yè)務的結合賦能中去,是否存在此種可能?想聽一聽專家的看法。

 dengjf99某股份制銀行軟件開發(fā)工程師:

大模型的資金和軟硬件資源的投入要求是非常高昂的,有的大行是規(guī)劃了數(shù)以億計的驚人投入,反而可能加劇馬太效應。另外,大模型是一個以NLP技術為主的模型,并不一定能解決銀行方方面面的業(yè)務問題。

建議在引入上還是以ROI評估為基礎進行實施評估。

 Cui Xiaonan NVIDIA英偉達DevRel:

首先LLM肯定是一個顛覆式的技術出現(xiàn),確實提供一種彎道超車的可能性,針對中小金融機構,比較落地可能是甄選一個適合自己的模型尺寸(參數(shù)量),集合自己的場景深耕下游任務,可以采用Fine tune或微調的方式快速起步。

16、ChatGPT大語言模型時代的企業(yè)如何適用和選擇?例如落地過程中的具體挑戰(zhàn)和企業(yè)的不適用性。

 daliu某金融機構系統(tǒng)架構師:

企業(yè)需要根據(jù)自身業(yè)務和需求來選擇和使用大語言模型,以下是個人幾點建議:

1)確定應用場景:要確定自身在語言模型方面應用場景,例如對于金融行業(yè),需要關注的重點領域是投資、風控、客戶服務等。

2)評估模型能力:要評估大語言模型的能力,包括模型的準確率、召回率等指標,以確保模型能夠滿足業(yè)務需求。

3)投入成本,包括硬件成本、以及與自有系統(tǒng)集成和適配成本,評估投入產出比。

4)數(shù)據(jù)安全:在使用大語言模型時,需要保障數(shù)據(jù)的安全性和隱私性。

 朱向東中原銀行高級工程師:

首先,ChatGPT是基于自然語言處理技術的AI模型,企業(yè)在適用和選擇ChatGPT時需要考慮業(yè)務需求、數(shù)據(jù)質量、硬件資源、模型可解釋性和服務支持等方面的問題,可以根據(jù)企業(yè)自身的實際情況和需求,選擇適合自己的ChatGPT模型和服務提供商,并在使用之前要充分評估和規(guī)劃相關的問題。

然后,ChatGPT在落地過程中可能會面臨數(shù)據(jù)隱私、模型魯棒性、模型可解釋性、資源成本和可信度等具體挑戰(zhàn),同時還需要考慮企業(yè)自身的實際業(yè)務場景和需求,在考慮引入ChatGPT之前,需要充分考慮這些問題,并采取相應的措施來解決這些問題。

 HiMy招商系統(tǒng)分析師:

隨著大語言模型技術的不斷發(fā)展,越來越多的企業(yè)開始應用這項技術來提高他們的業(yè)務效率和創(chuàng)新能力。下面是一些關于企業(yè)如何適用和選擇大語言模型的建議:

1)確定使用場景:企業(yè)應該在明確自己使用大語言模型的場景和目標后再進行選擇。例如,語音識別、自然語言處理和聊天機器人等場景都可以使用大語言模型。

2)考慮技術支持:大語言模型技術非常新穎和復雜,企業(yè)在選擇供應商或云平臺時需要考慮他們的技術支持能力和專業(yè)知識。供應商應該能夠提供及時的技術支持和培訓。

3)注意數(shù)據(jù)安全和隱私:使用大語言模型時涉及大量的數(shù)據(jù),企業(yè)需要確保數(shù)據(jù)安全和隱私保護。供應商應該有相應的安全保障措施和合規(guī)規(guī)定。

4)選擇適合的平臺:企業(yè)可以選擇云平臺或搭建自己的大語言模型平臺。選擇適合的平臺應該基于企業(yè)的規(guī)模、預算、技術實力等因素。

5)關注成本效益:使用大語言模型技術需要考慮成本效益。企業(yè)應該了解使用大語言模型的成本和收益,并基于此作出決策。

總之,企業(yè)應該在選擇和應用大語言模型技術時認真考慮自己的需求和目標,同時注意數(shù)據(jù)安全和成本效益。選擇合適的供應商或云平臺并獲得技術支持,有助于更好地應用大語言模型技術,提高企業(yè)的創(chuàng)新能力和效率。

THEEND

最新評論(評論僅代表用戶觀點)

更多
暫無評論