阿里巴巴 AI 「看圖回答」 測驗擊敗微軟、臉書、特斯拉,準確率還首次超越人類!
陳宜伶
2021-08-25
看圖回答問題是人類生活及溝通的基本條件,但是對 AI 來說卻是一項高難度任務。
阿里巴巴達摩學院打造出來的 AI 語言模型 AliceMind,幾天前首度打破圖像問答(VQA)世界紀錄,答題準確率甚至超越人類基準,並且擊敗同樣有參加挑戰的微軟、FB 隊伍,象徵達摩學院的人工智慧技術邁出關鍵一步。
VQA 挑戰是什麼?
圖像問答(Visual Question Answering)挑戰的緣起,是因為國際電腦視覺與技術辨識大會 (Conference on Computer Vision and Pattern Recognition,CVPR)希望鼓勵企業攻克 AI 多模態機器學習(MultiModal Machine Learning)的難題,因此從 2015 年開辦 VQA 挑戰賽,吸引來自世界各地的網路企業、科研單位參賽。
今年的 VQA 挑戰賽和往年一樣,題庫包含了超過 25 萬張真實照片,總共有 110 萬道題目。這些題目會考驗 AI 是否能辨別圖像,比如說在一張人群的照片中算出有幾個兒童、或是在圖片中辨認出書桌上的車鑰匙,進而推測房間主人是有車的。
VQA 技術已經被廣泛導入阿里巴巴平台,像是它的 AI 客服機器人「小蜜」(Alime)就已經被淘寶、天貓商家等電商平台採用。消費者輸入問題後,AI 客服會根據商品資訊和顧客問題給出答案。
另一方面,VQA 技術不僅能運用在電商,還可用於醫學圖像辨識,以及電動車的智慧駕駛分析。
阿里巴巴的 AI 模型為何成績能夠超越人類?
這幾年人工智慧(AI)逐漸滲透到各行業,也推動更多科技革命,AI 技術逐漸成為企業數位轉型、對抗疫情,並讓經濟重返正軌的重要力量。
由阿里巴巴達摩學院打造的 AI 深度語言模型系統 AliceMind 在這次的 VQA 測驗中,答題準確率拿到 81.26%,首次超越了人類答題的準確率 80.83% ,更讓馬雲投資的達摩學院在 AI 發展上取得重大進展。
AliceMind 採用了多種專有技術,包括多樣化的視覺表示(diverse visual representations)、「多模態」預訓練語言模型(multimodal pretrained language models)、「跨模態」語義融合和對齊技術( adaptive cross-modal semantic fusion and alignment technology)。這些技術不僅可以讓阿里巴巴的 AI 理解問題並分析圖像,還可以讓 AI 用近似人類的語感回答問題。
阿里巴巴達摩院自然語言處理(NLP)負責人 Si Luo 表示:「這代表我們在『機器學習』領域又取得了一個重要里程碑,AliceMind 在視覺與文本的『多模態』理解及推理上,測試分數媲美人類認知水準,彰顯了我們研發 AI 的努力成效。」
打造出這款 AI 模型的達摩學院是什麼來歷?
2017 年,馬雲認為阿里巴巴應該要把眼光放遠,致力解決未來世界經濟、社會等問題,在此願景下成立了研究單位「達摩學院」( DAMO Academy),號稱要在 3 年投入超過 1000 億人民幣,將重點放在基礎科學和顛覆式技術創新研究上。
Si Luo 表示,人工智慧分為運算智慧、感知智慧、認知智慧及創造智慧 4 個層次。這次 AliceMind 參與的 VQA 測試內容屬於認知智慧部份。
負責人也補充說,這不代表有一天我們會被機器人取代,反而這些智慧機器可以用來輔助我們的日常工作和生活,因此人們可以很專注在他們擅長的創作上。
資料來源:https://buzzorange.com/techorange/2021/08/25/vqa-ai-alibaba/
si醫學單位 在 新北創力坊 InnoSquare Facebook 的最佳解答
🍺🍺🍺感謝 醴醞啤酒 Liyun Beer 新創疼惜新創低價提供新創啤酒🍺🍺🍺
5/17(三)17:00 就是創力坊第五期 Demo Day進擊🥊🥊的時候了,在新北市經發局政府級的資源挹注💎、交大產業加速器國際級的神通培育🦄、及業師群的多面向車輪戰下🚗,團隊已經掙脫雜魚🐟的枷鎖,進化成新一代的新創,歡迎想投資新一代的新創產業,或是公司想鏈結新創轉型進化的單位/個人,先預約位子喔!!
報名連結【www.accupass.com/go/1060517】
1⃣ CooKoo (遞智科技 Calophasis)
🎯[新創] 創新開發以時間、地域、生活三維觸發,帶領您走向輕鬆智慧好生活
2⃣ 追風科技 ChaseWind
🎯[新創] 很厲害,好多No1,剛從矽谷 plug & Play 加速器修練回來,要再去
💰[資金] 種子輪 (美國算法)
🔒[鏈結] 模具廠
3⃣ 偉薩科技 Wasai
🎯[新創] 大數據軟硬整合解決方案,一台抵同業N台
💰[資金] A輪
🔒[鏈結] 晶片商、Server廠、SI
4⃣ Lawsnote 七法
🎯[新創] 為法律人設計的演算法和辨識系統,打造法律圈的搜尋系統 (小編提示 : 演算+AI+大數據+整合領域專長...懂了吧)
💰[資金] A輪
🔒[鏈結] 事務所、金融法遵
5⃣ Metology
🎯[新創] METOLOGY以協助糖尿病友維持生活品質為核心價值。Debby來指導,血糖不煩惱
💰[資金] 天使輪
🔒[鏈結] 健康食品電商、糖尿病共照網
6⃣ 姐的衣櫃 SistaCloset
🎯[新創] 模特兒時尚共享經濟
💰[資金] A輪
🔒[鏈結] Model經紀、設計師、VR
7⃣ Petalkr寵聊療 (沛邦科技)
🎯[新創] 用科技改變流浪動物困境,翻轉寵物產業現況與未來
💰[資金] 天使輪、Pre-A輪
🔒[鏈結] 中途之家、協會(流浪動物、工作犬...等等)、獸醫師、訓犬師、營養師
8⃣ 輕卡廚房 (斯凡國際)
🎯[新創] 藉由傳遞有醫學根據的瘦身知識,幫助消費者建立正確的瘦身觀念、達到健康瘦身的目的。也研發低卡沖泡食品包,即使不運動,也能利用熱量控制的方式達到健康瘦身的效果
9⃣ She Aspire她渴望 (啟妍)
🎯[新創] 以女性為主體的正面力推廣 & 弱勢培訓媒合
💰[資金] 天使輪
🔒[鏈結] CSR企業社會責任企業
1⃣ Yaker 優雅客
🎯[新創] 文創電商,專注圖像商品
1. 提供文創人才創意舞台,協助文創人才專注創作
2. 提供獨特實用文創商品,協助中小型工廠保存台灣製造
🔒[鏈結] 插畫家、文創商品工廠
2⃣ Han You Chinese Language Institute Delhi
🎯[新創] 印度華語文市場的崛起,她領先&要規模化
🔒[鏈結] 母語華語文人才