人人爱人人摸人人操,天堂电影在线观看免费入口,亚洲午夜精品a品久久

OpenAI研究人員研究新模型：將多媒體生成速度提高50倍

2小時前

鞭牛士

OpenAI 的兩位研究人員發(fā)表了一篇論文，描述了一種新型模型——具體來說是一種新型的連續(xù)時間一致性模型 (sCM)——與傳統(tǒng)擴散模型相比，該模型將人工智能生成圖像、視頻和音頻等多媒體的速度提高了 50 倍，生成圖像只需近十分之一秒，而常規(guī)擴散則需要 5 秒以上的時間。

本文來自鞭牛士（www.bianews.com）。

鞭牛士報道，10月24日消息，據(jù)外電報道，OpenAI的兩位研究人員發(fā)表了一篇論文，描述了一種新型模型——具體來說是一種新型的連續(xù)時間一致性模型(sCM)——與傳統(tǒng)擴散模型相比，該模型將人工智能生成圖像、視頻和音頻等多媒體的速度提高了50倍，生成圖像只需近十分之一秒，而常規(guī)擴散則需要5秒以上的時間。

通過引入sCM，OpenAI僅通過兩個采樣步驟就實現(xiàn)了相當?shù)臉颖举|量，提供了一種在不影響質量的情況下加速生成過程的解決方案。

該項創(chuàng)新在arXiv.org上發(fā)表的預同行評審論文和今天發(fā)布的博客文章中進行了描述，作者是程璐和楊松，該項創(chuàng)新使這些模型僅需兩步即可生成高質量樣本——比以前需要數(shù)百步的基于擴散的模型快得多。

Song還是OpenAI研究人員（包括前首席科學家Ilya Sutskever）于2023年發(fā)表的一篇論文的主要作者，該論文提出了一致性模型的概念，即同一軌跡上的點映射到同一初始點。

雖然擴散模型在生成逼真的圖像、3D模型、音頻和視頻方面取得了出色的效果，但其采樣效率低下（通常需要數(shù)十到數(shù)百個連續(xù)步驟）使其不太適合實時應用。

從理論上講，該技術可以為OpenAI的近實時AI圖像生成模型提供基礎。正如VentureBeat記者Sean Michael Kerner在我們的內部Slack頻道中沉思的那樣，「DALL-E 4還會遠嗎？」

保持高質量，同時加快采樣速度

傳統(tǒng)的擴散模型需要大量的去噪步驟來生成樣本，導致其速度較慢。

相比之下，sCM可在一兩步內直接將噪聲轉換為高質量樣本，從而減少了計算成本和時間。

OpenAI最大的sCM模型擁有15億個參數(shù)，可以在單個A100 GPU上僅用0.11秒生成一個樣本。

與擴散模型相比，這使得掛鐘時間加快了50倍，從而使實時生成AI應用更加可行。

使用更少的計算資源達到擴散模型質量

sCM背后的團隊在ImageNet 512×512上訓練了一個連續(xù)時間一致性模型，可擴展至15億個參數(shù)。

即使在這種規(guī)模下，該模型仍能保持與最佳擴散模型相媲美的樣本質量，在ImageNet 512×512上實現(xiàn)了1.88的Fréchet初始距離(FID)分數(shù)。

這使得樣本質量與擴散模型的差異在10%以內，而擴散模型需要更多的計算工作量才能獲得類似的結果。

基準測試顯示性能強勁

OpenAI的新方法已經與其他最先進的生成模型進行了廣泛的對比測試。

通過使用FID分數(shù)和有效采樣計算來測量樣本質量，研究表明sCM能夠以更少的計算開銷提供頂級結果。

雖然以前的快速采樣方法一直受到樣本質量下降或訓練設置復雜的困擾，但sCM成功克服了這些挑戰(zhàn)，兼具速度和高保真度。

sCM的成功還歸功于它能夠隨著從中提煉知識的教師傳播模型按比例擴展。

隨著sCM和教師擴散模型規(guī)模的擴大，樣本質量的差距進一步縮小，而sCM中采樣步驟數(shù)的增加會進一步縮小質量差異。

應用和未來用途

sCM模型的快速采樣和可擴展性為跨多個領域的實時生成AI開辟了新的可能性。

從圖像生成到音頻和視頻合成，sCM為需要快速、高質量輸出的應用程序提供了實用的解決方案。

此外，OpenAI的研究暗示了進一步系統(tǒng)優(yōu)化的潛力，可以進一步提高性能，并根據(jù)各個行業(yè)的特定需求定制這些模型。

THEEND

免責聲明：凡注明為其它來源的信息均轉自其它平臺，由網友自主投稿和發(fā)布、編輯整理上傳，對此類作品本站僅提供交流平臺，不為其版權負責。本網站對有關資料所引致的錯誤、不確或遺漏，概不負任何法律責任。若有來源標注錯誤或侵犯了您的合法權益，請作者持權屬證明與本站聯(lián)系，我們將及時更正、刪除，謝謝。聯(lián)系郵箱：xiali@infoobs.com

本月熱門

云計算的江湖，風云再起

10月8日
揭秘，IOTE國際物聯(lián)網展2025年巡展預告!

10月8日
防勒索病毒攻擊關鍵措施

10月8日
匯聚行業(yè)精英，探討前沿技術第十九屆汽車涂裝工藝技術研討會即將啟幕!

10月8日
網博會革新升級：“區(qū)域頻道”精準選型引領，引領智能制造新風潮

10月8日
萬億賽道!AI算力趨勢發(fā)展深度分析 2024

10月9日

精選文章

熱點資訊

高通宣布與谷歌達成多年戰(zhàn)略合作，提供生成式AI數(shù)字座艙解決方案

OpenAI研究人員研究新模型：將多媒體生成速度提高50倍

2024 信息化觀察網

長按掃描二維碼閱讀原文

OpenAI研究人員研究新模型：將多媒體生成速度提高50倍

最新評論（評論僅代表用戶觀點）

發(fā)展大模型，不打“籃球賽”而要“下圍棋”

不確定性是大模型在工業(yè)領域落地的關鍵難點

智能家居：科技賦能的生活新體驗

車企新舊勢力搶著上，端到端真能顛覆自動駕駛？

本月熱門

云計算的江湖，風云再起

揭秘，IOTE國際物聯(lián)網展2025年巡展預告!

防勒索病毒攻擊關鍵措施

匯聚行業(yè)精英，探討前沿技術第十九屆汽車涂裝工藝技術研討會即將啟幕!

網博會革新升級：“區(qū)域頻道”精準選型引領，引領智能制造新風潮

萬億賽道!AI算力趨勢發(fā)展深度分析 2024

精選文章

康毅：“核”芯“實力打造中國存儲，攜手共建信創(chuàng)生態(tài)

品茗科技榮獲“2022年度中國軟件技術領軍企業(yè)獎”

“政采云+樂采云”品牌全新亮相，雙輪驅動政企采購數(shù)字化新征程

2022（第七屆）中國網絡信息安全峰會將于7月5日在京召開

一款低成本、高回報的一站式軟硬件生產輔助工具【智慧生產數(shù)字基站】誕生了!

牛振東：智能數(shù)字圖書館發(fā)展及其在企業(yè)創(chuàng)新服務中應用探索

熱點資訊

共筑數(shù)字未來|深度解析數(shù)字化轉型與建設的戰(zhàn)略指南

數(shù)據(jù)要素X政策寶：引領企業(yè)和政策數(shù)據(jù)服務的新浪潮

政策寶|構筑企業(yè)與政策間的高效數(shù)據(jù)通道，跑出惠企助企加速度

政策智能匹配與業(yè)務線索：企業(yè)騰飛的雙重動力引擎!

鼎好DH3煥新顏，美的樓宇科技助力中關村地標綠色新生

高通宣布與谷歌達成多年戰(zhàn)略合作，提供生成式AI數(shù)字座艙解決方案

解析!數(shù)據(jù)技術和產業(yè)重點支持方向：數(shù)據(jù)存儲

OpenAI研究人員研究新模型：將多媒體生成速度提高50倍

最新評論（評論僅代表用戶觀點）

欄目推薦

發(fā)展大模型，不打“籃球賽”而要“下圍棋”

不確定性是大模型在工業(yè)領域落地的關鍵難點

智能家居：科技賦能的生活新體驗

車企新舊勢力搶著上，端到端真能顛覆自動駕駛？

本月熱門

精選文章

熱點資訊

高通宣布與谷歌達成多年戰(zhàn)略合作，提供生成式AI數(shù)字座艙解決方案

解析!數(shù)據(jù)技術和產業(yè)重點支持方向：數(shù)據(jù)存儲

發(fā)展大模型，不打“籃球賽”而要“下圍棋”

車企新舊勢力搶著上，端到端真能顛覆自動駕駛？

高通宣布與谷歌達成多年戰(zhàn)略合作，提供生成式AI數(shù)字座艙解決方案