Bing搶先ChatGPT發(fā)布的識(shí)圖功能

微軟悄悄上新了。日前,有網(wǎng)友發(fā)現(xiàn)自己的Bing Chat賬號(hào)新增了一個(gè)上傳圖片的入口。根據(jù)用戶上傳的圖片,Bing Chat就能識(shí)圖回答問(wèn)題。

本文來(lái)自微信公眾號(hào)“根新未來(lái)”。

微軟悄悄上新了。日前,有網(wǎng)友發(fā)現(xiàn)自己的Bing Chat賬號(hào)新增了一個(gè)上傳圖片的入口。根據(jù)用戶上傳的圖片,Bing Chat就能識(shí)圖回答問(wèn)題。

早在3月份,OpenAI在發(fā)布GPT-4時(shí),特別提出了GPT-4較GPT-3.5最大的亮點(diǎn)是圖像輸入功能,即GPT-4支持圖片輸入,可以看懂梗圖、看懂物理題,還能看懂論文。不過(guò)當(dāng)時(shí),該多模態(tài)功能尚處于研究預(yù)覽階段,還不能公開。

如今,微軟似乎要搶先ChatGPT一步發(fā)布識(shí)圖功能。在上個(gè)月Bing的大更新日志中,微軟就提到了會(huì)為使用GPT-4模型的Bing Chat加入多模態(tài)支持。

360截圖16251112669372.png

那么,“長(zhǎng)了眼睛”的Bing Chat到底是怎么樣的呢?

首先,針對(duì)看梗圖功能,Bing Chat根據(jù)網(wǎng)友上傳的一幅關(guān)于機(jī)器學(xué)習(xí)的梗圖漫畫,或者一張?jiān)谄嚿蠣C衣服的梗圖,就能準(zhǔn)確地答出圖中的內(nèi)容和笑點(diǎn),基本上可以說(shuō)是Get到了點(diǎn)位。其次,在識(shí)圖精確度的評(píng)測(cè)方面,網(wǎng)友上傳了《任天堂大亂斗》游戲的角色圖,同一張圖上有排列著非常多的角色,Bing Chat對(duì)其進(jìn)行了一一辨認(rèn)后,從12個(gè)角色中認(rèn)出了7個(gè)。結(jié)果而論,Bing Chat在二次元問(wèn)題上還有待進(jìn)一步提升。再者,在根據(jù)手繪圖編程網(wǎng)頁(yè)方面,Bing Chat對(duì)于網(wǎng)友給出的手畫“試題”,基本能夠搭出網(wǎng)頁(yè)的雛形。

在大語(yǔ)言模型升級(jí)的過(guò)程中,在文字理解和表達(dá)能力的基礎(chǔ)上,學(xué)習(xí)了視覺識(shí)別后的Bing Chat將具有更多的功能,給人類的使用帶來(lái)更大的方便。而曾經(jīng)一些難以用語(yǔ)言表達(dá)的內(nèi)容,現(xiàn)在都可以通過(guò)圖片進(jìn)行解決。甚至,具備了圖像識(shí)別功能的AI還可以在教育、醫(yī)療等領(lǐng)域發(fā)揮更大的作用和價(jià)值。比如,在教育領(lǐng)域,Bing Chat將可以擔(dān)任一個(gè)初高中乃至大學(xué)老師的角色,幫助學(xué)生解答復(fù)雜的數(shù)理化問(wèn)題。這將在很大程度上解決教育資源不均衡的問(wèn)題。在醫(yī)療領(lǐng)域,用戶還可以用它做基礎(chǔ)的醫(yī)療診斷,節(jié)約就醫(yī)所需要的金錢和時(shí)間。AI應(yīng)用在社會(huì)生活中的價(jià)值將由此得到最大化的實(shí)現(xiàn)。

由Bing Chat帶來(lái)的前景功能,無(wú)疑令人興奮的。但是,從目前的小范圍測(cè)試功能到完全向公眾開放識(shí)圖功能,確保公眾不會(huì)因?yàn)檎`信Bing Chat的回答而出現(xiàn)安全問(wèn)題,微軟還需要做大量的限制和調(diào)試,可謂任重道遠(yuǎn)。

THEEND

最新評(píng)論(評(píng)論僅代表用戶觀點(diǎn))

更多
暫無(wú)評(píng)論