《婦女節閱讀之二》
”關於性別數據落差很重要的一點,就是一般來說並非惡意或是故意的,事實跟這些相反。這是一個數千年下來慣性思考觀點的結果,是一種不用刻意去思考的預設立場 ..因為當我們一般說到“人類”,我們預設的是男性”
(One of the most important things to say about the gender data gap is that it is not generally malicious, or even deliberate. Quite the opposite. It is simply the product of a way of thinking that has been around for millennia and is therefore a kind of not thinking... Because when we say human, on the whole, we mean man.)
一開始買這本書,我也不太確定這是否會是一個在論述女性如何被歧視的著作。雖然我也是女性,但總覺得這樣的論述好像幫助有限。但讀完這本得獎無數的著作後,我終於明白他為何如此受肯定。過去當人們講到性別差異和歧視,常常都是用形容或是講述歷史的方法,來佐證自己的觀點。這本書有豐富的數據資料,但作者用清晰易懂的例子讓他不枯燥。
這本書最重要的觀點,是當世界大部分的事物,包括物品,醫療,制度等等,以男性為預設立場來設計時,即便並非刻意的排擠,但因著男女需求的不同,自然產生了排擠作用。而女性在這些沒有考慮到他們需求的設計中,產生的效果就會打折,然後就會加強 “女性比較弱,比較麻煩” 的既有刻板印象。大家可以想像當你在做一個市場調查時,如果一個客群佔50 %,甚至超過一點點,我們還會把它看成 “特例”,或是 “利基市場” 嗎?
本書作者身為經濟學家,把這些社會科學所能找尋到的各種數據,做了一個相當完整的呈現。有很多甚至連我自己身為女性都不知道的。以心臟病為例,書中講到我們大部分人想到的症狀,是所謂 “好萊塢式的心臟病” ,就是我們常常在電視電影當中看到一個人,痛苦地捂著胸口。但書中講到有不少的一部分女性,他們心臟病發的症狀不是胸口痛,反而是腹部的一些不適或是頭暈,因著這些數據相對不被重視,不少的女性因為這樣而錯失搶救的先機了。
在各樣數據餵養人工智慧算法,把很多事物加速自動化之際,作者呼籲回過頭來檢視這些數據的完整性。所有做人工智慧的都知道,你丟什麼樣的數據進去,它就生什麼樣的模型出來。但作者也把這個看成是一個機會,因為其實要針對兩性都考量的重新設計不見得是容易的,但這時候機器學習可以幫助我們從數據當中,看出不同的模式,進而選出一個最優化的結果。機器本身是沒有歧視性的,所以如果我們重視數據的包容性,再加上科技的輔助,或許可以幫助我們事半功倍。但前提是,所有的決策當中,需要納入女性的觀點與聲音。
建議大家在讀這本書的時候,試著拋開我們在台灣的經驗,因為在很多的例子當中,身在台灣的我們可能不太容易想像 (包括落後國家女性沒有安全的廁所,女性難民受到的暴力威脅,等等)。作者在許多的訪談章中常舉一個例子(書中也有寫):相較於男廁,女廁總是大排長龍,這背後的設計表面上看似公平,但仔細分析起來卻不見得是如此。這一段相信所有的女生讀了,都可以感同身受。
作者最後用一個很有趣的例子,來說明納入女性的觀點和數據,如何帶來突破。1997 年,在美國康乃爾大學有一場數學論壇,學者們試著要將數學理論上的雙曲空間在實體事件能夠展現出來。在場男性的數學家試著用紙張折出這些曲面 (很難吧)。一名從拉脫維亞來的女數學家 Daina Tamina靈光一現,立刻開始用打毛線做出針織作品,成功的將理論上的雙曲空間,用實體的方式呈現。當這個被歸類為女性化的經驗,在一個被歸類為男性化的數學學界中,帶出截然不同的視角時,新的一條路就這麼走出來了。
雖然這個世界還有很大的進步空間可以更加的包容,但我是抱持著正面的態度。當家中五歲小男孩看見我這本書的封面時,立刻問我 “為什麼上面沒有女生?” ,我給他看書的封面設計,女性圖像是隱藏的,並跟他解釋這本書就是在說明這件事。他似懂非懂的問“為什麼會隱形呢?應該大家都要在上面”
我相信下一代的孩子們,一定會創造一個更加包容整全的世界。
全文語相關圖片和中文版連結在部落格中👇
https://dushuyizhi.net/invisible-women-被隱形的女性/
#InvisibleWomen #CarolineCriadoPerez #Datascience #BigData #被隱形的女性 #大數據 #社會科學
同時也有10000部Youtube影片,追蹤數超過2,910的網紅コバにゃんチャンネル,也在其Youtube影片中提到,...
「datascience中文」的推薦目錄:
- 關於datascience中文 在 讀書e誌 Facebook 的最佳貼文
- 關於datascience中文 在 紀老師程式教學網 Facebook 的精選貼文
- 關於datascience中文 在 紀老師程式教學網 Facebook 的精選貼文
- 關於datascience中文 在 コバにゃんチャンネル Youtube 的最佳解答
- 關於datascience中文 在 大象中醫 Youtube 的最讚貼文
- 關於datascience中文 在 大象中醫 Youtube 的精選貼文
- 關於datascience中文 在 [問題] 中文資料集分類- 看板DataScience - 批踢踢實業坊 的評價
- 關於datascience中文 在 chinese_NLP/R中文分词.Rmd at master - GitHub 的評價
- 關於datascience中文 在 問題驅動型數據科學(中文字幕) - YouTube 的評價
datascience中文 在 紀老師程式教學網 Facebook 的精選貼文
[好站介紹] 大數據學院(Big Data University)
---- 免費的資料科學(Data Science)影音教學網
http://bigdatauniversity.com/
#BigData #DataScience #elearning
「大數據」(也可以翻譯成「巨量資料」)是近年來人人朗朗上口、但真的要解釋清楚又不容易的名詞。它在資訊學科裡,屬於「資料科學」(Data Science)這個分支。是一門可以從看似雜亂的原始資料,用統計的方式,找出特定趨勢的學問。舉大家都看過的例子,就像購物網站裡「您可能也喜歡...」,然後撈出一堆貨品讓你覺得「哎?電腦怎麼這麼聰明?知道這些東西也是我喜歡的?」其實就是分析網站裡每個人的購物習慣,找出與你相似的人「買了、但你沒買」的物品而已。
這類人需要很強的「統計」與「資訊」背景,大家也知道「統計」不好學,想當然爾這類人才當然很稀少。偏偏目前市場上對這類人才需求孔急,於是各家網路行銷公司紛紛出高薪挖兼具「統計」與「資訊」背景的「大數據」人才。而想投入就業市場的朋友,也在高薪的誘惑之下,前仆後繼地往「大數據」這個領域移動。
今天要介紹給大家的,是個與「大數據」有關的免費教學網站,叫做「Big Data University」。您可以用 Google 或 Facebook 帳號登入,就可以享用該站提供的免費課程。要成為大數據人才需要有的技能,該網站都幫您提供了。我還幫大家找了一些專有名詞的說明網站,希望大家喜歡。該網站提供的大數據課程分類如下:
1. 統計基礎
(1) Big Data Fundamentals 課程
(2) Data Science Fundamentals 課程
2. 資料分析工具
(1) Introduction to R 課程
(2) Introduction to Data Analysis Using R 課程
(R軟體/R語言簡介請參看: http://goo.gl/UtfVhq )
3. 資料視覺化/呈現工具
(1) Introduction to OpenRefine 課程
(OpenRefine 簡介請參看: http://goo.gl/4b6D22 )
4. 資料庫相關課程
(1) SQL Fundamentals 課程
(2) Introduction to NoSQL 課程
(NoSQL 簡介請參看: http://goo.gl/SUI2wX )
5. 大數據使用的程式語言、函式庫
(1) Hadoop Fundamentals (Hadoop: 大數據常用程式語言)
(2) Spark Fundamentals (Spark: 大數據好用函式庫/軟體框架)
(Hadoop 簡介請參看: https://goo.gl/rR7J6z )
(Spark 簡介請參看: http://goo.gl/KUV6Bw )
對於小弟如此用心補充各種專有名詞中文資料可以按讚鼓勵一下嗎? XD 你對大數據有什麼看法呢?還是有什麼問題想問呢?歡迎在下方留言喔!
如果你覺得 Big Data University 太讚了!你可以轉發給 Facebook 的其他朋友。邀請有興趣的同好一起來學,不懂時互相討論,在某人想放棄時鼓勵他堅持下去,不是很美好的一件事嗎?
希望今天的分享您會喜歡,也希望能對增加您資訊專業這方面做出一點貢獻!
datascience中文 在 紀老師程式教學網 Facebook 的精選貼文
[課程推薦] 九門大數據(Big Data)線上學程,由約翰霍普金斯大學開設,US$470,2015/11/02 開課!
(#BigData #eLearning #DataScience #OnlineCourses #Coursera)
https://goo.gl/8Tfi7m
咳嗯...先說大家關心的價格問題...雖然我會盡量介紹免費的程式設計學習資源,但今天這個「學程」(並非單一門課,而是由九門課整合而成)並非免費,索價 US$470(折合台幣約 NT$15300 左右)。雖然看上去有點貴,但對比坊間補習班上一門課就要一兩萬,這邊只要一萬五左右就有九門課。我個人覺得蠻物超所值的啦~所以趕快介紹給大家!
「大數據」(一說「資料科學(Data Science)」)這幾年蠻熱門的!該領域希望從雜亂無章的輸入資料,整理出特定的趨勢,並預測系統或人類下一步的行為。舉例來說,Amazon 可以由你瀏覽、購買的書籍,猜到你喜歡哪一類書,進而推薦你可能有興趣的書給你。台北市的公共自行單車 Ubike,可以藉由民眾的租借資料,整理出哪個站點需求量比較大,多久後單車會不夠,進而在特定時間、特定站點,補充單車數量。
這類人才不容易取得,不但要能撰寫程式,還要能操作大數據相關軟體(R,Matlab... 等),且大多要求要有統計的背景。加上目前需求孔急,所以起薪不低,也造就大家學習大數據課程的風氣。今天介紹的是 Coursera 提供的「Launch Your Career in Data Science(開始你的資料科學生涯)」學程,堂堂正正地幫您匯集了資料科學九門課,學完還有證書,讓您在面試資料科學相關職務時,能抬頭挺胸地說:「是的!我會資料科學!」
這九門課分別為:
1. 數據科學家的工具箱(有中文版,教你用 R,Git...等軟體工具)
2. R 語言程序開發(有中文版,教你 R 語言語法)
3. 獲取和整理數據(如何「撈」資料 + 如何「洗」出你要的資料)
4. 探索性數據分析(如何在資料間遊走,並統整出特定趨勢)
5. 可重複性研究(講怎麼做出一個讓別人也能「重現」你的實驗結果的分析報告)
6. 統計推斷(利用統計,推斷出某一結果,並透過檢討資料漏失量、偏差...來呈現你的結果有「多可靠」或「多準確」)
7. 回歸模型(用現有資料,找出一個數學模型套用,並希望用這個數學模型,預測將來的資料)
8. 實用機器學習(Machine Learning 介紹)
9. 數據產品開發(當一個統計模型被驗證為「可靠」後,就變成「產品」,可用它來做各種應用與預測)
最後還要交一個畢業專題,整個學程看起來很紮實,相信學過的同學應該收穫很多才是。
如果你覺得這個課程不錯,歡迎多多分享給你 Facebook 上的其他朋友。一起上課也比較有個伴喔!
希望今天的分享,對大家有幫助!
datascience中文 在 コバにゃんチャンネル Youtube 的最佳解答
datascience中文 在 大象中醫 Youtube 的最讚貼文
datascience中文 在 大象中醫 Youtube 的精選貼文
datascience中文 在 chinese_NLP/R中文分词.Rmd at master - GitHub 的推薦與評價
中文 自然语言处理. Contribute to hope-data-science/chinese_NLP development by creating an account on GitHub. ... <看更多>
datascience中文 在 [問題] 中文資料集分類- 看板DataScience - 批踢踢實業坊 的推薦與評價
小弟初探資料科學
將中文信件資料集分類為兩類B、C(依信件內容機密度)
若是已經將內容用jieba切好了
也使用TfidfTransform計算出每封e-mail的TF-IDF值
想請問接下來該怎麼繼續操作
SVM k-means
可以請大大推薦可以讓我學習的文章或youtube教學嗎
謝謝
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 59.120.67.6
※ 文章網址: https://www.ptt.cc/bbs/DataScience/M.1535422939.A.617.html
... <看更多>