實作 8 個專案,學習自然語言處理 Python,機器學習,深度學習,SpaCy,NLTK,Sklearn,CNN
https://softnshare.com/complete-natural-language-processing-nlp-with-spacy-nltk/
nlp機器學習 在 台灣物聯網實驗室 IOT Labs Facebook 的精選貼文
阿里巴巴 AI 「看圖回答」 測驗擊敗微軟、臉書、特斯拉,準確率還首次超越人類!
陳宜伶
2021-08-25
看圖回答問題是人類生活及溝通的基本條件,但是對 AI 來說卻是一項高難度任務。
阿里巴巴達摩學院打造出來的 AI 語言模型 AliceMind,幾天前首度打破圖像問答(VQA)世界紀錄,答題準確率甚至超越人類基準,並且擊敗同樣有參加挑戰的微軟、FB 隊伍,象徵達摩學院的人工智慧技術邁出關鍵一步。
VQA 挑戰是什麼?
圖像問答(Visual Question Answering)挑戰的緣起,是因為國際電腦視覺與技術辨識大會 (Conference on Computer Vision and Pattern Recognition,CVPR)希望鼓勵企業攻克 AI 多模態機器學習(MultiModal Machine Learning)的難題,因此從 2015 年開辦 VQA 挑戰賽,吸引來自世界各地的網路企業、科研單位參賽。
今年的 VQA 挑戰賽和往年一樣,題庫包含了超過 25 萬張真實照片,總共有 110 萬道題目。這些題目會考驗 AI 是否能辨別圖像,比如說在一張人群的照片中算出有幾個兒童、或是在圖片中辨認出書桌上的車鑰匙,進而推測房間主人是有車的。
VQA 技術已經被廣泛導入阿里巴巴平台,像是它的 AI 客服機器人「小蜜」(Alime)就已經被淘寶、天貓商家等電商平台採用。消費者輸入問題後,AI 客服會根據商品資訊和顧客問題給出答案。
另一方面,VQA 技術不僅能運用在電商,還可用於醫學圖像辨識,以及電動車的智慧駕駛分析。
阿里巴巴的 AI 模型為何成績能夠超越人類?
這幾年人工智慧(AI)逐漸滲透到各行業,也推動更多科技革命,AI 技術逐漸成為企業數位轉型、對抗疫情,並讓經濟重返正軌的重要力量。
由阿里巴巴達摩學院打造的 AI 深度語言模型系統 AliceMind 在這次的 VQA 測驗中,答題準確率拿到 81.26%,首次超越了人類答題的準確率 80.83% ,更讓馬雲投資的達摩學院在 AI 發展上取得重大進展。
AliceMind 採用了多種專有技術,包括多樣化的視覺表示(diverse visual representations)、「多模態」預訓練語言模型(multimodal pretrained language models)、「跨模態」語義融合和對齊技術( adaptive cross-modal semantic fusion and alignment technology)。這些技術不僅可以讓阿里巴巴的 AI 理解問題並分析圖像,還可以讓 AI 用近似人類的語感回答問題。
阿里巴巴達摩院自然語言處理(NLP)負責人 Si Luo 表示:「這代表我們在『機器學習』領域又取得了一個重要里程碑,AliceMind 在視覺與文本的『多模態』理解及推理上,測試分數媲美人類認知水準,彰顯了我們研發 AI 的努力成效。」
打造出這款 AI 模型的達摩學院是什麼來歷?
2017 年,馬雲認為阿里巴巴應該要把眼光放遠,致力解決未來世界經濟、社會等問題,在此願景下成立了研究單位「達摩學院」( DAMO Academy),號稱要在 3 年投入超過 1000 億人民幣,將重點放在基礎科學和顛覆式技術創新研究上。
Si Luo 表示,人工智慧分為運算智慧、感知智慧、認知智慧及創造智慧 4 個層次。這次 AliceMind 參與的 VQA 測試內容屬於認知智慧部份。
負責人也補充說,這不代表有一天我們會被機器人取代,反而這些智慧機器可以用來輔助我們的日常工作和生活,因此人們可以很專注在他們擅長的創作上。
資料來源:https://buzzorange.com/techorange/2021/08/25/vqa-ai-alibaba/
nlp機器學習 在 台灣物聯網實驗室 IOT Labs Facebook 的精選貼文
十年養成玉山AI力,下一步瞄準零接觸金融
為實現「科技的玉山」目標,玉山培養千人科技聯隊,其中包括資訊處800人組成的「神經系統」、智金處100人組成的「AI大腦」
文/王若樸 | 2021-08-16發表
.
今年5月疫情爆發,政府啟動勞工紓困專案,「短短幾天,玉山就湧入數十萬件申請案件!」玉山銀行董事長黃男州回憶。
但在短時間內,玉山就一條鞭消化這些爆量申請,撥出60、70億元貸款,甚至不動用大量人力就能完成。他們靠的是機器人流程自動化(RPA)和AI,自動審核超過80%的申請案件,黃男州驕傲地說:「這就是科技的力量!」在這之中,AI更是一股重要力量。
比如2年前,玉山已開始將AI落地到金融服務中。他們自建信用卡盜刷偵測模型,0.1秒就能判斷信用卡是否被冒用,一天用上數十萬次,一年更省下上億元的損失。
不只如此,他們也自行開發理財認知偏好推薦AI 模型,能根據客戶承受風險等級和交易紀錄,在7秒內推薦最合適的5檔基金。
就連貸款,也高度仰賴AI。玉山利用機器學習打造零人工介入的線上貸款流程,最快58秒就可撥出款項。在風控領域,更用AI加速黑名單掃描、風險評估,甚至是辨識詐騙帳戶,精準度還比傳統人工方法高出40倍。
玉山AI力不是一夕成軍,而是十年養成
玉山AI遍地開花,可不是一夕成就。
回到2012年,玉山啟動第三個十年目標,要從服務的玉山、專業的玉山,邁向科技的玉山。那時,原本100多人規模的玉山資訊處,已開始大動作延攬人才,成為玉山千人科技聯隊的濫觴。
在技術研究和實作方向上,也開始轉變。2013年,玉山大舉將資料分析成果應用到數位業務,兩年後更成立創新發展中心(IDC),來觀察新技術。
那一年,2015年,玉山進一步調整關鍵組織,一方面專注發展新業務領域,一方面將AI技術落地到實務場景中。他們成立數位金融處,設置全臺第一個金融數位長職位,來專攻數位金融服務。數金處瞄準普惠金融、場景金融和智慧金融三大目標,要讓金融如水電便利、走到顧客生活中,還要用AI來優化服務流程。
這也是首次,AI罕見地出現在玉山重要業務組織的任務中。數金處誕生後,也成為科技聯隊一員。
不只調整組織,玉山在基礎建設上,也往AI靠攏。2016年,玉山開始設計新核心系統、制定4年汰換上線計畫,除了將老舊的程式語言COBOL,汰換為時下熱門的.NET和Java語言之外,更重要的是,將原本大型主機的「大核心」模式,轉換為小核心的微服務架構和開放式平臺。如此一來,玉山就能更快速更迭服務,也更容易共享資料,讓後續的AI模型開發更便利。
2017年,玉山進一步著墨新技術研究。他們成立創新實驗室(Innovation Lab),來鑽研AI、區塊鏈、身分辨識、電子支付等前瞻技術,同時下設研發、商轉、顧問和育成四大中心,來鞏固技術人才資源佈局。
2018年,迎來了玉山AI力養成的關鍵轉捩點。
當時,他們率先全臺成立科技長辦公室,定調金融AI發展藍圖,還終止多個不乏達上千萬元等級的專案,改將資源投注在AI上。那年,玉山開始打造自家機器學習即服務(MLaaS)平臺,成為後來AI落地的關鍵基礎設施之一。
但設立科技長辦公室還不夠。2019年,玉山還成立專責單位,將運作十多年的大數據分析團隊CRV,正式轉型為負責開發AI應用的智能金融處,成為內部AI供應商,要將AI融入到玉山各個業務中。
這兩個組織,也陸續成為玉山科技聯隊的核心成員,形成科技聯隊資訊處、數金處與智金處的鐵三角架構。至此,玉山AI組織到位、關鍵團隊正式成形,成為「科技的玉山」中一股重要推力。
神經系統、AI大腦相互分工,下一步瞄準零接觸金融
這個科技聯隊規模達上千人。黃男州進一步解析,科技聯隊有四大成員,包括800多人組成的資訊處與信用卡處IT團隊、100多人的數位暨客群處、100多人的智金處,以及30人的資安處。
如果資訊處是玉山的神經系統,負責串起各種業務流程,那麼,智金處就是「玉山的大腦系統。」黃男州比喻,這個AI大腦專門解析大量資料,用機器學習將資料轉化為有益業務的AI系統,優化服務。
而玉山之所以敢大力嘗試AI,是因為科技聯隊中,有個扮演「煞車角色」的資安處。這個部門規模雖小,但負責檢核IT應用安全性,成為創新的煞車。黃男州甚至形容:「如果沒有煞車,大家只會慢速前進!」正因為有它,科技聯隊才敢加速,才敢創新,甚至是嘗試AI新技術。
不只如此,對玉山AI大腦來說,他們還有顆很重要的強韌「心臟」,也就是去年上線的新核心系統。黃男州指出,開放式新核心平臺主打交易、會計分離,能處理更大量的交易,與一年前相比,交易量成長可達50%,尖峰時段甚至更高。
這對AI大腦有著深遠影響。因為,更多的交易量,意味著更多的資料,「大腦也就更聰明。」
他甚至直言,核心系統上線後,迎來了AI應用大爆發的寒武紀:在行銷面,AI可以找出顧客下一個最需要的產品、分析顧客生命周期對玉山的整體貢獻,在風控面,AI可以快速掃完幾百份報紙、找出關鍵名詞建立黑名單,也能快速揪出信用卡盜刷交易、即時阻擋。
甚至還能優化客服中心,「客服通話一定要真人嗎?人工語音也能回答很多問題,」黃男州還舉例,透過語音轉文字,還能大規模檢驗客服品質、改善客戶服務。
不只如此,對他來說,AI還能自動化更多流程,舉凡財富管理、申請貸款、開戶等原本需要人工處理的業務,都包括在內。玉山也預告,零接觸金融是他們下一個發展目標。
玉山金控科技長張智星更透露,未來還要以NLP為核心,來發展AI客服,以及其他金融業務的流程自動化;只要主管機關開放,玉山就會用技術力轉化為零接觸金融服務。
這些遍地開花的AI應用,不是偶一為之。在各種AI服務落地前,玉山早已大動作重整組織、調整文化,組成100多人的AI開發團隊,來打造專用技術平臺,提供源源不絕的AI活水。接下來,我們將從戰略面、組織面、技術面來剖析玉山AI力。
AI如何成為科技玉山的重要力量
2012年
啟動第三個十年目標:科技的玉山
2013年
開始將資料分析成果運用到數位業務
2015年
成立創新發展中心(IDC),研究新技術;成立數位金融處,設置全臺第一位金融數位長,瞄準普惠金融、場景金融和智慧金融,要用AI槓桿優化金融服務
2016年
開始設計新核心系統架構、擬定4年上線計畫,要從大型主機的「大核心」邁向微服務架構的「小核心」,該架構也讓資料分享更容易
2017年
成立創新實驗室(Innovation Lab),研究區塊鏈、AI、身分辨識、電子支付、大數據和AR/VR等六大技術,下設研發、商轉、顧問和育成四大中心,鞏固技術人才資源
2018年
鎖定AI,領先全臺金融界成立科技長辦公室、設置科技長,開始建立專屬AI生產技術工具
2019年
原有大數據分析團隊CRV轉型為智能金融處,由科技長擔任處長,專門打造AI應用;科技聯隊鐵三角正式成形
2020年
新核心系統上線,開放式平臺特性將交易、會計分離,一年後交易量比舊時代成長至少40%至50%,更多資料有益於AI分析
2021年
智金處內部改組,強調服務落地及相關法遵風管;至此,玉山AI已在賦能、風控、流程、行銷、服務等5大領域遍地開花
附圖:玉山銀行董事長黃男州形容,玉山千人科技聯隊中的智金處是玉山「AI大腦」,負責解析大量資料、打造更聰明的金融AI服務。(圖片來源/玉山金控)
資料來源:https://www.ithome.com.tw/news/146179?fbclid=IwAR1ZGGV7rmCLnHqS3zT4JWw8IKtEqnDuzIW2doXP30OKL6uVHeAL0j-TzhY
nlp機器學習 在 常見NLP任務-文本分類- Lagi daripada AI 知識特助 的推薦與評價
02:07. 如何讓 機器 看得懂文字? 3 November 2021 jam 9:43 PTG · 82. Paparan. 2 orang menyukai ini. 13:44. 『 提升AI 實力的黃金三角 學習 法』. ... <看更多>
nlp機器學習 在 第一屆《 NLP 自然語言機器學習馬拉松》100天刻意練習 的推薦與評價
第一屆《 NLP 自然語言機器學習馬拉松》100天刻意練習,掌握NLP 與機器學習關鍵技術. Contribute to jumpingchu/1st-NLP100Days development by creating an account ... ... <看更多>