AI 如何為公司創造更多價值?專家:2 個缺陷,要先由人類來修補
2021/05/13
採訪‧撰文
盧廷羲
張凱崴
美國人工智慧國家安全委員會(NSCAI)今年 4 月建議,國防部每年應至少分配 3.4% 的預算投入科技領域,並提撥 80 億美元研發 AI。企業方面,微軟(Microsoft)4 月宣布,將以 197 億美元收購語音辨識開發商紐安斯通訊(Nuance Communications);後者是雲端與 AI 軟體的先驅。
從企業到國家,都愈來愈重視人工智慧,知道要想辦法運用 AI 創造更好的生活。不過,目前 AI 發展到底處於什麼階段?我們又該如何應用?
美國加州大學洛杉磯分校(UCLA)電腦科學系助理教授張凱崴形容,目前人工智慧技術已經可以幫助人類完成很多事,像是疫情來襲,電腦可以從大數據中篩選條件,自動搜尋、判讀潛在病例,幫助醫生大幅減少檢查時間,但 AI 也並非萬能,要先認知它的局限。他研究如何讓 AI 更符合人性,獲得 2021 年的史隆研究獎(Sloan Research Fellowships)。
AI 局限1. 資料寬廣度不足時,就會複製人類偏見
張凱崴認為,電腦在學習的時候,是依賴「彙整數據資料」來判斷,並沒有真正思考,如果資料來源太狹隘、不夠多元,資料寬廣度不足,電腦判斷就會出現偏差,「你跟電腦講清楚 input(輸入)、output(輸出),提供足夠的數據資料,它可以對應、學得很好,但還有很多面向 AI 做不到。」
舉例來說,亞馬遜(Amazon)2014 年推出智慧音箱(Amazon Echo),使用者口頭下指令給語音助理 Alexa 就能放音樂、查資訊。然而,有些人口音較罕見,或是用字較特殊,智慧音箱的資料庫沒有「不同口音」「不同用詞」的檔案,就可能失靈,這是當前 AI 的其中一大問題。
張凱崴進一步解釋,AI 另一項挑戰是,它無法清楚分辨「不曾出現」與「不能出現」(無法出現)之間的區別,只是從資料統計出要學的東西,無法像人類一樣進行邏輯思辨。
AI 的運作方式,第一步是輸入資料,第二步是分析,但這過程容易出現偏見。例如電腦在理解「總統」這個字,會去看四周有什麼字詞,來學習總統這個詞,由於許多總統都是男性,電腦就會「覺得」總統是男性。
這也是為什麼,如果讓 AI 學習,在它的認知裡,女性「不可能」當美國總統(因為沒有資料紀錄)。「你可以跟人類說,任何職業、性別都是平等的,但對電腦來講,這很困難,」張凱崴說明,一旦資料的寬廣度受限,電腦就容易產生偏見。
就像在自然語言處理(Natural Language Processing,讓電腦把輸入的語言變成有意義的符號)領域,張凱崴說明,AI需要知道代名詞指的是「哪個名詞」,才能運算下去。但如果資料受限,使用男性的「他」,電腦可能判斷這個代名詞是指總統、總理、執行長;但換成女性的「她」,由於數據不足,電腦就會混亂,出現系統性誤差。
他再舉一例,美國人工智慧研究組織 OpenAI 提出「生成式預先訓練」系統(GPT,Generative Pre-training),推出到 GPT3 版本,屬於書寫類 AI,電腦能夠揣測人們說完上一句話,下一句可能會講的句子,自動完成後半段。
好比有人上一句寫下「我正在和教授聊天」,系統可能推導出「我們在研究室討論學術問題」,因為電腦藉由蒐集來的語料資料中判讀出「教授」和「學術」具高度相關。但研究也顯示,GPT2(前一代版本)系統也從資料中學習到許多偏見,像是如果句子前半談論白人男性,系統傾向產生正面評價;如果句子前半是黑人女性,系統竟會產生負面句子。對企業來說,許多組織接觸 AI,想讓它們取代部分工作,首先需要留意資料的廣度、多元性,才能減少電腦犯錯的機會。
AI 局限2. 即便條件相同,也無法每次都做出正確判斷
「其實,現在的 AI 就像一台原型飛機,還缺乏穩定性。」張凱崴說,現行的 AI 就好比萊特兄弟(Wright brothers)剛發明飛機,看似可以做很多有趣的事,但「可以飛」跟「飛得很好」,有一大段落差。
紐西蘭的簽證系統曾鬧出笑話。人們上傳簽證照片,AI 掃描後,確認是不是本人,但當時系統沒有估算到某些亞洲人眼睛比較小,一名亞裔男子被判定「沒有張開眼睛」,因此照片無效。
張凱崴說,在這個例子中,凸顯出 AI 的穩定性不足,「系統沒有考慮到不同人種的差異,很死板地認為你眼睛沒張開。」所謂的缺乏穩定性,指的是 AI 沒辦法在相同條件下,每次都做出正確決策,這也是使用 AI 時,須留意的第二個挑戰。
他再舉例,許多模型可以準確分析,一則影評對電影的評價是正面或負面。然而研究顯示,有時只要將影評中一些字換成同義詞,例如把電影(movie)換成影片(film),或改寫句子,即使意思並未改變,系統卻把原本判斷為正面的影評標註成負面。這顯示AI系統還未真正了解語言的含義。
在設計這些程式時,人們必須注意到 AI 可能有局限,設定的資料範圍要更完整,考慮這些因素,就能減少偏見、落差,進而加強穩定性。
餵指令給 AI 要多元化,嘗試「換句話說」、刻意混淆
經理人雖然不一定具備 AI 方面的專業知識,但只要掌握觀念,再透過 AI 領域專才協助,也能優化系統。張凱崴指出,最直接的方法是,設計 AI 模型時,要把來源群組不同的資料分門別類測試,在測試階段讓群體多元化,並確保不同特色的使用者,用起來都沒有問題。
舉例來說,一套 A 系統擁有來自各地的使用者,如果設計者是台北人,設計系統的思維容易以台北生活為主,很可能因為當地習慣不同,導致花蓮使用者操作不順。
另一個方法,則是用不同的「語意」,去測試 AI 有沒有徹底學會一個概念。例如,有一套餐廳評鑑的 AI 系統,只要蒐集、整理使用者意見,就能判斷每個顧客對於餐廳的評比是高分或低分。那麼要如何確認這套系統的穩定性?張凱崴建議,可以利用「抽換詞面」的方法。
比如,把詞彙換成同義字,再看 AI 是否能運算出相同結果,「你可能會發現,原本評比結果是食物很美味,但如果美味換成比較困難的詞,AI 就會分不出這則評比是好是壞。」因此在訓練模型時,可以將詞彙隨機抽換成同義詞,增加 AI 的詞彙量。
第三種方式更進階:改變句型、重寫句子。張凱崴指出,同樣一句話,如果換成不同說法,電腦可能判讀錯誤,將「因為發生 A 事件,所以導致 B 事件」,改寫成「B 事件發生了,是因為 A 事件的緣故」,明明兩句話意思一樣,但 AI 很可能因為穩定性不足,搞混兩者的差別。如果要鞏固 AI 的穩定性,可以使用自動改寫的方式,增加資料的多樣性。
張凱崴表示,經過這些測試,讓 AI 接受更多元化的訓練,得到更廣的學習範圍,往後碰到同義詞、相似資訊,才能有效判讀。
張凱崴總結,AI 還在快速發展,或許可以創造更多工作機會、新的職位,但現行階段,它只是輔助角色。AI 並非魔術盒子,使用它就一定有更好結果,人們還是要保持高度耐心,先認識它的缺陷,才能在技術更迭下,發揮出最好的結果。
張凱崴
台灣大學資訊工程系碩士、美國伊利諾大學(UIUC)電腦科學博士。美國加州大學洛杉磯分校(UCLA)電腦科學系助理教授,研究領域包括人工智慧、機器學習、自然語言處理。2021 年獲得史隆研究獎(Sloan Research Fellowship),研究團隊開發的運算方法,使人類語言處理的程序更有效率、更多元,同時兼具公平性。
附圖:優化AI系統的3方法
資料來源:https://www.managertoday.com.tw/articles/view/62902?fbclid=IwAR2jI1bhg1anqct0AZZR_3LKKJqIsvG0wz2whSN8iniROZApHt-_qpD7dis
協助同義詞 在 Facebook 的精選貼文
#西亞 #伊斯蘭 #國際關係 #國際情勢
2001年 -- 2021年 🇦🇫 #阿富汗戰爭
『阿富汗素有「帝國墳場」之稱,因為歷史上的帝國和國家在那裏的征服和佔領都以失敗告終。19世紀中的 #第一次英阿戰爭 期間,英國和東印度公司的軍隊一度佔領喀布爾。但當地人的反抗令英軍損失慘重,被迫撤出喀布爾。』
「#1979年 底開始,持續了9年的蘇聯-阿富汗戰爭最後也以蘇軍撤出告終。阿富汗戰爭的失敗甚至被認為是促成 #蘇聯解體 的原因之一。」
『2001年10月7日,#九一一恐怖 攻擊尚未「滿月」,美國與英國聯軍對距離美國本土1萬2000公里的阿富汗發動攻擊。4天之後,時任 #美國總統小布希 在白宮的東廳(East Room)舉行記者會,向驚魂未定、疑懼難消的國民打包票:這場戰爭不會是21世紀版的越戰。
將近20個年頭過去,數千名美軍與 #北約(#NATO)部隊仍然駐紮在這個中亞國家。阿富汗戰爭論時間已經超過越戰,也是美國立國以來最漫長的一場戰爭,代價:近2500名官兵陣亡、逾2萬名官兵傷殘。阿富汗方面更為悲慘:逾6萬4000名軍警陣亡、逾11萬名平民陪葬。』
『那麼,當年招惹美國大軍的兩個目標呢?恐怖組織「#基地」(Al-Qaeda)勢力大不如前但至今猶存,還引來小老弟 #伊斯蘭國(IS);#神學士(Taliban)從政權轉型為游擊隊如魚得水;長期以鄉村包圍城市。美國的另一個目標是協助阿富汗成為一個穩定、民主、現代化的國家,但今日的 #喀布爾(Kabul)政權卻是衰弱、貪腐、無能、內鬥的同義詞。』
『在 #911事件 20週年之際,這場耗時20年、軍費消耗將近2.5兆美元的「天價苦戰」,終於要果斷落幕——事實上,美軍全面撤軍的決定,早在川普政權末期就已拍板下令,但當時無論是阿富汗政府軍、北約盟國、美軍內部、甚至是川普的共和黨團卻都大力反彈。』
《彭博》報導,布林肯在ABC週日晨間節目「本週」(This Week)專訪中指出,美軍從阿富汗撤出符合拜登政府的執政目標,「恐怖威脅已經轉移到其他地方,我們有其他重要事項待處理,包括與中國關係、氣候變遷和疫情等,這些是我們必須投入能量和資源的地方。」
「最令北京擔心的是,阿富汗會變成維吾爾人組織進行跨界活動的基地,吸引來世界其他地區的激進分子,對臨近的 #新疆 展開新的 #聖戰。」
『反對拜登撤軍決策的人批評,奢望破滅之後,阿富汗社會狀況將是慘不忍睹,美國將蒙上「背棄盟邦」罪名,國際形象因此重挫。此外,無論是神學士重掌政權或者內戰全面爆發,都可能會讓阿富汗再度成為全球恐怖組織、恐怖攻擊的「孵化器」,甚至迫使美國再度軍事介入;2011年的伊拉克撤軍堪為殷鑑。』
地圖來源:
https://www.mapsofworld.com/afghanistan/
文字引述:BBC中文網、風傳媒專欄、自由時報、轉角國際
協助同義詞 在 伍家謙 Facebook 的最佳貼文
#有感而發
你至今的人生,試過幾多次半途而廢?
大概每一個人,都曾經對未來有憧憬;「我大個之後要成為 _ _ _!」,幾乎是童年/少年/青年時代的必喊口號。結果口號真的淪為口號,只能掛在嘴邊,能夠實現兒時夢想的,沒有幾個。
「我大個之後要成為運動員!」
這句,就是我的「口號」。
*****我係比伍家謙更靚仔嘅分隔線*****
我小學就開始習泳。當初父母認為游泳為必要求生技能,就把我送到游泳班;慢慢下來,開始參加比賽,竟然有點成績,就被安排接受更專業的訓練;專業是嚴格的同義詞,晨操晚練太辛苦,加上遇上瓶頸,時間久久沒有進步,慢慢,我放棄了。
初中開始迷上籃球,和同學柴娃娃到街場跟隊很快樂;後來被選入校隊,再出外參加一些較認真的球隊,也很高興。我以為這次真的找到自己的志趣,找到我真正想做的事情了;可是到再長大一點,志趣敵不過現實,在籃球和升學就業之間,我只能合符大眾期望地選擇後者。
「都唔細啦,唔好發夢喇。」
當時廿來歲的我跟自己如此說道。
*****我係比伍家謙更靚仔嘅分隔線*****
如今回想,也不是沒有遺憾的。遺憾沒有當上運動員之外,我更痛恨自己的窩囊;我沒有為自己的夢想盡過全力,我不夠忠於自己。
男人未過三十,有許多事情未夠成熟體會。人生的比賽由球場移師生活,人大了,知道不能再半途而廢;縱然還是有很多事與願違,但至少懂得堅持不放棄。每天營營役役,連夢想也不再掛在嘴邊。因為我跟自己說,人生的比賽,我沒有中途放棄的資格,我不想到老來回憶舊時,只能不停重覆「如果我當年 _ _ _,我而家就 _ _ _啦。」
然後,我好像想通了一點事情。
「如果我當年繼續練水,我而家就代表香港啦!」
「如果我當年繼續打波,我而家就做咗職業球員啦!」
這種事,總是在我的人生反覆出現;
自己是那樣的喜歡籃球,如今我在遺憾廿年前沒有努力打球,到廿年之後,我想我還是會遺憾沒有趁四十歲還能跑時多打一點的。
不想留憾,惟一方法就只有全力以赴。那天我立即找同好商量,很快就在各方協助下成立了一支傳媒籃球隊 #Mediators;除了為把握能夠打球的有限光陰之外,我們還想用自身故事告訴大家:只要肯開始,沒有事情會太遲的;正如我們的口號 #NeverTooLate,不要再重蹈覆轍,別再讓未來的你如現在般只能對過去遺憾,讓自己成為一個最好版本的自己。
運動,是我的人生導師。如果我的文字能令你有熱血感覺的話,我誠意推薦大家留意ViuTV的原創劇《男排女將》。由文字轉成影像,由真正喜歡排球的鄧麗欣飾演球員,應該能令你有更深感受。劇中Stephy的角色是一名港隊前球員,因種種原因放棄運動,只成為一名普通OL,但最後選擇再次拾起排球。我相信那些追夢的情節,應該可以成為大家於現時低迷氣壓下的助燃劑。11月23日起,逢星期一至五晚上9點半於ViuTV 99台播出。
Btw,有意開拍籃球版的話,不妨找我,inspired by true story。
《男排女將》預告片:https://bit.ly/375TksW
#ViuTV #男排女將 #球不著地永不放棄
協助同義詞 在 協助同義詞在PTT/Dcard完整相關資訊 - 諸葛亮 的推薦與評價
關於「協助同義詞」標籤,搜尋引擎有相關的訊息討論:. [PDF] 同義詞詞林(擴展版) - Association for Computational Linguistics同義詞在資訊擷取與語義分類上是很 ... ... <看更多>
協助同義詞 在 協助同義詞英文在PTT/Dcard完整相關資訊 - 輕鬆健身去 的推薦與評價
透過的反义词,透過的同义词,跟透過类似的词语:通過,進行,協助,參與, ...幫忙同義詞-2021-01-09 | 動漫二維世界英文字典- 加拿大打工度假最佳解答-20200803Google ... ... <看更多>
協助同義詞 在 協助同義詞在PTT/Dcard完整相關資訊 - 諸葛亮 的推薦與評價
關於「協助同義詞」標籤,搜尋引擎有相關的訊息討論:. [PDF] 同義詞詞林(擴展版) - Association for Computational Linguistics同義詞在資訊擷取與語義分類上是很 ... ... <看更多>