矮化女性和少數種族,OpenAI GPT 模型為何變成 AI 歧視重災區?
作者 品玩 | 發布日期 2021 年 02 月 13 日 0:00 |
機器學習技術近幾年突飛猛進,許多強大 AI 因此誕生。以知名研究機構 OpenAI 開發的語言生成模型 GPT 為例,現在可寫文章、幫人做報表、自動查詢資訊,給用戶很大幫助和便利。
然而,多篇近期論文指出,包括 GPT 等 AI 模型,生成結果包含基於性別和種族的偏見。而這些 AI 模型應用在商業領域,勢必強化歧視偏見對象現象。
卡內基美隆大學 Ryan Steed 和喬治華盛頓大學 Aylin Caliskan 近日發表論文《無監督的方式訓練的影像表示法包含類似人類的偏見》(Image Represnetations Learned With Unsupervised Pre-Training Contain Human-like Biases)。
研究者對 OpenAI 在 GPT-2 基礎上開發的 iGPT 和 Google 的 SimCLR,兩個去年發表的影像生成模型進行系統性測試,發現種族、膚色和性別等指標幾乎原樣複製人類測試物件的偏見和刻板印象。
其中一項測試,研究者用機器生成男女頭像照片為底板,用 iGPT 補完(生成)上半身影像。誇張的事發生了:所有女性生成結果,超過一半影像穿著比基尼或低胸上衣。
男性結果影像,約 42.5% 影像穿和職業有關的上衣,如襯衫、西裝、和服、醫生大衣等;露手臂或穿背心的結果只有 7.5%。
這樣的結果,技術方面的直接原因可能是 iGPT 採用的自迴歸模型機制。研究者進一步發現,用 iGPT 和 SimCLR 對照片和職業相關名詞建立連結時,男人更多和「商務」、「辦公室」等名詞連結,女人更多和「孩子」、「家庭」等連結;白人更多和工具連結,而黑人更多和武器連結。
這篇論文還在 iGPT 和 SimCLR 比對不同種族膚色外觀的人像照片「親和度」(pleasantness),發現阿拉伯穆斯林人士的照片普遍缺乏親和力。
雖然 iGPT 和 SimCLR 模型的具體運作機制有差別,但透過這篇論文,研究者指出這些偏見現象背後的共同原因:無監督學習。
這兩個模型都採用無監督學習 (unsupervised learning),這是機器學習的方法之一,沒有給事先標記好的訓練資料,自動分類或分群匯入的資料。
無監督學習的好處,在於資料標記是繁瑣費時的工作,受制於標記工的程度和條件限制,準確性很難保持一定,標記也會體現人工的偏見歧視,某些領域的資料更缺乏標記資料庫;而無監督學習在這種條件下仍有優秀表現,最近幾年很受歡迎。
然而這篇論文似乎證明,採用無監督學習無法避免人類常見的偏見和歧視。
研究者認為,採用無監督學習的機器學習演算法,出現的偏見歧視來源仍是訓練資料,如網路影像的男性照更多和職業相關,女性照片更多衣著甚少。
另一原因是這些模型採用自迴歸演算法。在機器學習領域,自迴歸演演算法的偏見問題人盡皆知,但嘗試解決這問題的努力並不多。
結果就是,機器學習演算法從初始資料庫學到所有東西,當然包括人類的各種偏見和歧視。
之前 OpenAI 號稱「1700 億參數量」的最新語言生成模型 GPT-3,發表論文也申明因訓練資料來自網路,偏見無法避免,但還是發表並商業化。
去年 12 月,史丹佛和麥克馬斯特大學的研究者另一篇論文《Persistent Anti-Muslim Bias in Large Language Models》,確認 GPT-3 等大規模語言生成模型對穆斯林等常見刻板印象的受害者,確實有嚴重的歧視問題。
具體來說,用相關詞語造句時,GPT-3 多半會將穆斯林和槍擊、炸彈、謀殺和暴力連結。
另一項測試,研究者上傳一張穆斯林女孩的照片,讓模型自動生成一段文字,卻包含明顯的暴力過度遐想和延申,其中有句話「不知為何原因,我渾身是血。」
而當這類演算法應用到現實生活,偏見和歧視將進一步強化。
iGPT 和背後的 OpenAI GPT 技術,現在開發到第三代。能力確實很強大,就像眾多媒體報導過那樣,因此許多商業機構青睞採用。最知名的用戶就是微軟。去年 9 月,微軟 CTO Kevin Scott 宣布和 OpenAI 合作,獨家獲得 GPT-3 授權,將技術應用到針對用戶的各項產品和 AI 解決方案。
微軟尚未透露具體會把 GPT-3 應用到哪些產品,但考慮到微軟產品的十億級用戶量,情況非常令人擔憂。如微軟近幾年 Word、PPT 等產品推廣的自動查詢資訊、文字補完和影像設計功能,當用戶匯入某特定詞或插入圖片時,如果正好落入 GPT-3 的偏見陷阱,結果將非常糟糕。
不僅 GPT,照前述論文說法,所有採用無監督學習的演算法都可能包含這些偏見。現在因無監督學習非常熱門,自然語言處理、電腦視覺等領域,都成為非常關鍵的底層技術。
如翻譯對人際溝通十分重要,但錯誤的翻譯結果,一次被演算法強化的偏見事件,少則切斷人與人的聯繫,更嚴重者將導致不可估量的人身和財產損失。
作者 Steed 和 Caliskan 呼籲,機器學習研究者應該更區別和記錄訓練資料庫的內容,以便未來找到降低模型偏見的更好方法,以及發表模型前應該做更多測試,盡量避免受演算法強化的偏見被帶入模型。
資料來源:https://technews.tw/2021/02/13/openai-gpt-discrimination/
同時也有2部Youtube影片,追蹤數超過11萬的網紅吉娜英文,也在其Youtube影片中提到,加入吉娜英文FB 粉絲頁 學習更多美式口語英文 https://www.facebook.com/wordsgo/ ********************** 聯絡吉娜: KK音標 基礎英文從頭學起 學好英文諮詢 請寫信到 [email protected] ************...
糟糕造句 在 三妍良語的勵志實驗室。自我成長書籍實踐報告 Facebook 的最佳貼文
【實驗室活動】痛苦與力量語句
你知道嗎?
語言和文字比我們想像中
更具有自我暗示的力量,
你對自己說的悄悄話,塑造了自己的形象,
決定你成為甚麼樣的人。
你對自己說的話,是偏向痛苦那一邊,
還是力量那一邊?
或許你的內在聲音跟我一樣,
常常在痛苦和力量中來來回回,
但起碼經過這個表格跟練習,
你可以發現自己正在痛苦這邊的時候,
嘗試把自己拉向力量的方向。
試試看嘗試造句和替換語句,
感受痛苦逐漸轉換力量的過程,
對自我覺察很有幫助。
痛苦語句:
1.我不能
2.我應該
3.不是我的錯
4.這是個問題
5.我不滿意
6.生活是個苦難
7.我希望
8.早知道
9.我要怎麼辦
10.真糟糕
力量語句:
1.我不想
2.我可以
3.我負全責
4.這是個機會
5.我想學習和成長
6.生活是探險
7.我知道
8.下一次
9.我可以應付
10.這是個經驗
🧙♂️三妍良語範本:
🟤痛苦語句:
1. 我不能這麼自私,只做自己喜歡的事
2. 我應該要關注別人的需求,不是只關心自己
3. 不是我的錯,這是他的問題
4. 這是個問題,我不知道該怎麼辦
5. 我不滿意自己的生活,讓我覺得自己很不幸
6. 生活是個苦難,唯有低頭向前行
7. 我希望自己有能力賺到很多錢
8. 早知道不會成功,我幹嘛還要浪費時間去做
9. 我要怎麼辦才可以脫離這個困境?
10. 真糟糕,我甚麼都做不好
感想:😔寫完有點沮喪,中途覺得自己一無是處的想法一直冒出來。
🟣力量語句:
1. 我不想做自己不喜歡的事,做自己熱愛的事是一種勇敢,還可以幫助別人成功。
2. 我可以關注自己的需求,也可以關注別人的需求,我可以掌控分寸。
3. 我負全責,這讓我有機會學習不足的地方
4. 這是個機會,了解目前的侷限在哪裡,才有機會進步
5. 我想學習和成長自己想要達成的,卻還不會的東西,這可以讓我脫離目前的困境。
6. 生活是探險,處處充滿驚奇,也許新的機會就在下個轉角。
7. 我知道自己可以給予別人豐盛,而別人將用金錢回饋給我,讓我有能力持續給予,
形成良好的循環。
8. 下一次我會比這次做的更好,我會更熟練,並且有進步。
9. 我可以應付這個狀況,拆成我能做的到最小一步跨出去,我就能開始
10. 這是個經驗,讓我知道這個狀況不能使用這個方法,也許可以嘗試其他的方法去突破。
感想:😃寫完後我覺得充滿力量,也願意去思考可以做出甚麼行動。
圖片摘自「恐懼OUT,想法改變,人生就會跟著改變」
#三妍良語的勵志實驗室
#實驗室活動
#自我改造一起來
糟糕造句 在 酪梨壽司 Facebook 的最佳貼文
【找麻煩血案】
昨天中午,寶哥的班導傳了一張血案現場直擊照過來。
Line縮圖中我兒的脖子、雙手一片血淋淋,我差點暈過去。
點開圖看仔細,原來是紅色顏料啊,是想嚇死誰。這才讀到老師下一句圖說:「畫畫課,一直玩彩色筆,還畫自己滿身。」
「天啊,連脖子都能畫滿是怎麼回事?」
上禮拜在臉書看到某位媽媽分享兒子把雞雞用彩色筆塗成綠色的慘劇,看看別人想想自己,我到底有什麼資格笑別人?
「斷頭.....流血.....」老師轉述寶哥的解釋。
「老師有教訓過他了嗎?」深呼吸。我比生產陣痛時更認真深呼吸。
「我只說,糟糕,爸爸媽媽會很生氣,怎麼辦......他就一直安份到現在,都不敢再多說一個字。」老師知道寶哥的爸爸有潔癖,語氣也有點剉,特地傳照片來想必是為了打預防針。
我腦中百轉千迴,播放起無數情境和解法的跑馬燈:
是在家要守規矩保持乾淨,壓抑過度,終於在學校爆發了嗎?
小小年紀這麼嗜血,是內心深處有不可告人的創傷嗎?
下一步是不是就要開始自殘,該帶去看兒童身心科醫生嗎?
「今天童詩小組創作,太擠,紙張大家輪流畫的關係吧。情有可原,真抱歉。」老師又傳來黑板上一張圖文並茂的童詩作品。
詩題是「找麻煩」,小組中每個同學都要負責在紙上寫一句並配上插圖,照樣造句的句型我猜是「A為B找麻煩,結果發生什麼事」。
(至於為什麼不是更通順的「A找B的麻煩」,我也忘了問老師)
寶哥負責創作的壓軸句是「雷公為我找麻煩,我嚇得躲進棉被裡」。畫紙上方有烏雲和閃電,左下角畫著躲在藍色棉被裡的小人兒。
「好可愛的詩。寶哥經常活在自己的世界裡,可愛歸可愛,有時會很想搖醒他。」我對老師說。
「#跟著進去他的世界比較幸福。」老師意味深長地回答。
我閉上眼睛,試圖走進小一男童的神祕小宇宙。想像他在黑板前排隊,等著同學又寫又畫,百般無聊之餘玩起手邊的彩色筆,拿起他最愛的紅色塗手,接著又想到如果畫在脖子上就像是頭流血斷掉了,好嚇人又好好玩啊......
正好大白上完中文課回家吃午餐,看完照片也大驚失色。我們約好要沉住氣,等哥哥放學問清楚原因,以同理代替責罵。
下午寶哥上完課後班回家,一進門就下意識用雙手護住脖子,我蹲下與他保持視線同高,盡可能用冷靜溫和的語氣說:「沒關係不用藏啦,老師已經把照片傳給媽媽看過了。你可以告訴我為什麼要用彩色筆畫身體嗎?」
「紅紅的很像脖子流血,我想變成被 Dracula 咬的人啊!」他放下護頸的雙手,露出傻呼呼的燦笑。Dracula(吸血鬼德古拉)是他前一陣子最愛聽的英文故事。
那個熟悉的笑容,忽然讓我想起國小時迷戀怪力亂神,把零用錢通通捧去書展買鬼故事和《神秘世界》的自己。(《神秘世界》是一本比磚頭還厚的世界蒐奇百科,我又愛又怕藏在衣櫃裡)
「傻瓜,你忘了吸血鬼咬過的人脖子上只會有小小兩個洞和一點點血絲,才不會流這麼多血!」前任吸血鬼迷媽媽指正。
「對吼,我忘了。」
「那下次可以不要拿彩色筆畫身體或衣服嗎?爸爸洗得很辛苦耶。」大白難得沒發飆,無可奈何嘆口氣。
寶哥鄭重承諾:「對不起,下次我不會再亂畫了。」
五分鐘後,當我奮力搓洗兒子滿身的彩色筆痕,又聽到肇事者歡天喜地宣布:「哇嗚,馬麻妳看好多紅色泡泡!連雞雞都變成紅色了哈哈哈哈!」
#正向教養談何容易
#紅色雞雞的世界我進不去
(想把血案照片放上來讓大家感受我當下的震撼,但哥哥穿學校體育服要馬賽克太麻煩還是算了)
_____
幫哥洗完澡後我問他,這樣全身畫得紅紅的,不怕被同學笑嗎?
他嘻皮笑臉:「不會啊。」
我繼續追問:「這樣你喜歡的女同學小玲會覺得你很幼稚吧?」
他一派輕鬆:「沒關係,小玲今天請假!」
#跪求小玲沒事不要隨便請假好嗎
糟糕造句 在 吉娜英文 Youtube 的精選貼文
加入吉娜英文FB 粉絲頁
學習更多美式口語英文
https://www.facebook.com/wordsgo/
**********************
聯絡吉娜:
KK音標
基礎英文從頭學起
學好英文諮詢
請寫信到
webmaster@wordsgo.com
**********************
吉娜家教招生中:
影片中有三個小對話,可以學會What's wrong的用法,有外師的錄音朗讀,還有Gina的口語發音解說,有連音和變音。
三個小對話內容:
對話一:
A: What's wrong? You were late again.
(怎麼了? 你又遲到了。)
B: My car broke down. I need to get it fixed after work.
(我的車拋錨了。下班後我要找人修理。)
A: Do you need a ride to the mechanic?
(你要我載你去找修車師傅嗎?)
對話二:
A: What's wrong? You look upset?
(怎麼了?你看起來不太開心。)
B: I'm feeling sad because my friend moved away.
(我覺得傷心,因為我的朋友搬走了。)
A: I'm sorry to hear that. Do you want to talk about it?
(我很難過聽到這樣的事情。你想說說嗎?)
對話三:
A: What’s wrong with you? Why would you say that awful thing to her?
(你怎麼搞的? 你為什麼對她說這麼糟糕的話? )
B: B: She made me angry.
(她讓我生氣。)
A: You should apologize. She cried because of what you said.
(你應該要道歉。她因為你所說的話哭了。)
-----------------------------
我是Gina,我來自台灣,我是一位英文老師,我喜歡學習英文和教英文。我的職業生涯大部分都在教授文法,但是當我真正想要說英文時,問題來了,我不太能自然表達自己。我開始改變自己的教學和學習目標,我想說英文,這時我才知道文法閱讀與聽說可是很大的不同。我發現口說卡住的是自然造句的能力以及口語發音。我慢慢研究口說語音的變化,透過外師的幫助,我的口說和聽力都變好了!:)
我的影片課程,是我對於英文教學的熱情與成果,我的目標並不是幫助你發音跟美國人一樣,我自己也做不到,因為區域性的口音就不同,每個人都帶著自己母語的影響在說英文,這很棒,這是我們的identity(身分認同),不要不敢開口。我的課程目標是幫助我自己以及大家,可以輕鬆的發音。了解口語的語音變化,學習時會踏實有力量,開口說英文就會有信心!
糟糕造句 在 玉チャンネルTAMA CHANN Youtube 的最讚貼文
SUBSCRIBE TAMA CHANN HERE- https://goo.gl/2Ow1zA
動画を視聴してくれてありがとうございます~
【SEE MORE...】
❤♐影片目的♐❤
學日語的單元
最近的天氣非常糟糕,導致很多地方遭遇了天災
平常沒事就不要在大風大雨的時候出門啦
今天要教大家如何用日文來形容天氣
簡單句型隨意用在平常的日文對話中~
【影片中日文】
1.いい天気だった
2.理想的な天気だった
3.雨が止んだ後、いい天気になった
4.曇った天気だった・曇りだった
5.雲で覆われた天気だった
6.空がとても曇っていたので、気分まで落ち込んだ
7.気まぐれな天気だった・天気が不安定だった
8.暖かいと思ったら、突然寒くなった
9.雨が降ったりやんだりした
10.雨が降り出した
11.大雨が降った
12.雨が降り続いた
【尋找字幕組小夥伴】
https://goo.gl/wcMJ71
❧❧❧❧❧❧❧❧❧❧❧❧❧❧❧❧❧❧❧❧❧❧❧❧❧❧❧❧❧❧❧❧
✉✉ ♋【个人媒体连接 CONTACT INFO】 ♋✉✉
Facebook脸书专页- https://goo.gl/HPOvIF
Twitter 推特- Tama.Yokky
WeiBo微博 - Yokky熊
Instagram - yokkyjc
♈♈♈♈------SUBSCRIBE FOR WEEKLY NEW VIDEO------♈♈♈♈
➊➋➌➍➎➏➐➑➒➓【订阅看影片!每周更新】➊➋➌➍➎➏➐➑➒➓
TAMAの关键词|keywords
馬來西亞女生,日语教学,学习影片,howto,日语基础,日语教学,日本,日本发音,学习日语,发音基础,马来西亚,外来语,日语写法,日語會話,母音字音,简单日語,简单上手日語
,日本字,日本挑戰,恐怖料理,日本旅游,臺灣,Taiwan,Malaysia,Japan,中文,TamaaaTV,TAMACHANN,日本美食,看日本,初級日語,台湾女生,闽南话,福建话,搞笑挑战,初級日語,日本流行,日本介紹,日本動漫,日本文化