重大突破!阿里達(dá)摩院創(chuàng)全球新紀(jì)錄:AI“讀圖會(huì)意”首次超越人類

科技評(píng)論142閱讀模式

從阿里云官方獲悉,近日,國際權(quán)威機(jī)器視覺問答榜單VQA Leaderboard出現(xiàn)關(guān)鍵突破,阿里巴巴達(dá)摩院以81.26%的準(zhǔn)確率創(chuàng)造了新紀(jì)錄,讓AI在“讀圖會(huì)意”上首次超越人類基準(zhǔn)。

近10年來,AI技術(shù)保持高速發(fā)展。然而在視覺問答VQA(Visual Question Answering)這一涉及視覺-文本多模態(tài)理解的高階認(rèn)知任務(wù)上,AI始終未取得超越人類水平的突破。

重大突破!阿里達(dá)摩院創(chuàng)全球新紀(jì)錄:AI“讀圖會(huì)意”首次超越人類-圖片1

自然語言技術(shù)與計(jì)算機(jī)視覺交融,是多模態(tài)領(lǐng)域重要的前沿研究方向。其中,VQA是AI領(lǐng)域難度最高的挑戰(zhàn)之一,對(duì)研發(fā)通用AI具有重要意義。

VQA的任務(wù)是根據(jù)給定圖片及自然語言問題,生成正確的自然語言回答。

例如下面這張圖,圖中玩具人的IP出自哪部電影?AI先提取了問題關(guān)鍵信息——玩具人;再根據(jù)常識(shí)做出回答——星球大戰(zhàn)。

重大突破!阿里達(dá)摩院創(chuàng)全球新紀(jì)錄:AI“讀圖會(huì)意”首次超越人類-圖片2

在首屆VQA挑戰(zhàn)賽上,AI的最高準(zhǔn)確率僅能達(dá)到55%。今年8月,達(dá)摩院以81.26%的準(zhǔn)確率創(chuàng)造VQA Leaderboard全球紀(jì)錄,首次超越人類基準(zhǔn)線80.83%。

這是VQA測試以來,AI第一次超過人類水平,是標(biāo)志性的重大突破。

重大突破!阿里達(dá)摩院創(chuàng)全球新紀(jì)錄:AI“讀圖會(huì)意”首次超越人類-圖片3

 
  • 本文由 米粒 發(fā)表于 2021年8月14日13:30:28
  • 轉(zhuǎn)載請(qǐng)務(wù)必保留本文鏈接:http://m.bjmhhq.com/101977.html

發(fā)表評(píng)論

匿名網(wǎng)友
:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen:
確定

拖動(dòng)滑塊以完成驗(yàn)證