你知道嗎?【「平均壽命」並不是國民年齡的平均】#本日冷知識1543
小編科宅在高中地理課曾讀到:非洲波札那因為愛滋病沉重的打擊,國民平均壽命一度下降了 20 歲 [1]。主因是病毒擊垮了一整代青壯年,繼而小孩子忽然喪失撫養,很悲。後來又學到:1918 年西班牙流感一舉讓米國國民的平均壽命掉了 12 歲。不單米國,其他各國也多半是 10~20 歲之間的驚人幅度 [2]。
* 然而歷史教訓無路用,還是不肯戴口罩。要增進國際觀就應該研究歷史地理。看新聞是什麼斜門歪道。¯\_(ツ)_/¯
但我一向容易畫錯重點,立刻有個疑問是:太奇怪了。這兩種疫情都特別讓年輕人掛點,這樣「平均壽命」不是反而應該增加嗎?
那時我真心以為平均壽命的意思是大家拿身分證出來,取歲數的平均。一個類比是,如果班上數學段考平均成績是 50 分(貴校數學超殺),假設成績不滿 50 分的同學不計入,其餘人的分數平均顯然會增加。如果病毒讓青年喪命,剩下較老的成年人,平均值應該會有一樣的變化。
然後我就短暫忘了這事,作為人生的伏流,這個迷思一直到大學才重新冒出來——在一堂叫生物統計學的課。基本上給了我當頭棒喝長出三層包......平均壽命根本不是那個意思!
謎題得解後我一直想寫。但是齁~細細想來,這個概念實在太奇怪,很不直觀,我可不想用數學公式嚇跑大家。怎麼辦怎麼辦?
直到有天電視在播〈SASUKE! 極限體能王〉,看著選手紛紛在障礙物前英勇的落水的姿態,忽然讓我的腦袋過電。啊,懂惹,極限體能王根本和人生一模一樣!咦?容我解釋 XDD
好ㄉ。咱們話說從頭,平均壽命當然不是全體國民的歲數平均,明顯的從台灣的人口金字塔 [3] 可以看出平均數和中位數約莫是在 40 幾歲的地方。而不是常說的平均壽命的 80 歲。顯然是兩個不同的東西。
很不幸的,平均壽命這個約定俗成的翻譯頗為糟糕——我應該不會是唯一望文生義誤會的人吧。其原文是 Life Expectancy,稍微比較好的翻譯是「預期壽命」。今後稱之。但不細加解釋恐怕還是不會瞭改。
預期壽命其實本來是保險業者發明出來的概念,相關的專有名詞是叫「生命表」(Life Table)的東西。因為保險業說白了就是在和大眾對賭,合理的保險金應設定為新收的錢要多過給出的理賠金額,保險公司才能獲利。因此,為了作莊,保險公司必須對人口中不同年齡的人忽然發生不幸的一般情形瞭若指掌。具體而言是:各年齡的人之平均死亡率。
當今天有一批客戶買保險,就能根據生命表來預計明年會有多少蒙主寵召,後年有多少羽化升仙,十年後有多少早登極樂等等。才可以根據這調查預估一開始要收多少保費,加以精算與平衡,保險業才不會變慈善事業。
所以講白了,Expectancy 到底指是什麼的期望?就是我一直在換詞避諱的那件事,對於足夠大的客戶群體,平均會在幾年後發生。就醬。後來這個概念被推廣到一整個國家的一年一年的新生兒身上,就變成了預期壽命了。
回來講到極限體能王:讓我們想像人生是一個闖關大舞台,中途有許多障礙會讓挑戰者落入三途之川。而且就像斯芬克斯的謎題,挑戰者還會從四條腿→兩條腿→三條腿→坐電動輪椅這樣的變化(喂!)。總之那些障礙物的難度有高有低。分析方法就是去統計大量挑戰者的通過率。
藉由基本假設:在給定年齡遇到的障礙(俗稱劫數)難度不會變動,主辦單位就可以估計說新一批例如 10,000 名參賽者【平均落水的地點】會在哪裡了。那就是預期壽命的白話文概念。講完。
呃,對,仔細一講就會覺得齁,統計各國的該數值並互相比較,真是有變態到的一件事。
它能反映的東西也頗為侷限,就只是各國各自的「障礙賽道」的難度而已。像日本 (84.5) 的難度最簡易,阿富汗 (50.3) 難度是怕爆。
不同國家有不同的醫療衛生保健內憂外患的水準,賽道的難度便有差別。如在前工業時代的古早古早,傳染病、戰亂、飢荒(天啟四騎士之三)再加上新生兒夭折、產婦難產或感染症等災害,是最主要的落水因素。隨著時代與生活條件的進步,參賽者也會逐漸突破到更遠的地方。怎麼描述起來有點像超級馬力歐。
接著來討論「預期壽命」這個數值各種奇怪不直觀的地方。
首先,剛剛說計算預期壽命的最大假設是「障礙難度不變」,但那是不可能的,實際上戰亂傳染病等突發情形會使死亡率增加,而普遍的物質進步會持續降低各種可預防的死亡率。因此在這樣的波動之中,今年出生的嬰兒和去年出生的嬰兒會有不同的預期壽命。
而如開頭所說的那些情況,戰爭飢荒傳染病的肆虐會忽然讓一整代人的預期壽命降低,又在災後產生顯著巨幅的反彈,所以它天生是個浮動不穩定的值。
這時想到 2020 就......扶額。島國以外舞台的難度都遽然增加。
更怪的還有,假設我出生那年的男性預期壽命是 75 歲好了,那我和我同歲的幾萬名男嬰到最後,真的會平均在 75 歲死掉嗎?答案當然不是,因為,如果沒有意外,科技持續進步的情形下,「賽道」會隨著我們變老而越來越簡單。(應該啦......如果今年不是 2020 寫這段我會更有信心的。)
* 甚至「奇點主義者」主張說:搞不好第一個永生的人已經出生在地球上了。他們的想像是隨著這個人活到 30 歲,科技的進步已經延長人類壽命 50 歲,以此類推,遞增無止期......若不是今年是 2020 看到科學、科技界的醜態百出,本人也是很想相信這個美好 der 願景啦。
邏輯出問題出在,用於估計我們這批人在 50 歲的淘汰率的數值根本是別人的(比我整整老 50 歲的那代人),畢竟也無法跳進抽屜裡的時光機去偷看未來。所以技術上預期壽命甚至並不是任何人壽命的實際預期。因為它的基本假設並不精確成立,只是個盡人事(收保費)所進行的推估而已。
台灣的新生兒預期壽命目前大概是 80 歲,細想起來這是很不得了的事情。台灣人的人生賽道超級平坦,只可惜馬路如虎口,馬路安全要是搞好搞不好便立刻追上日本了 ← 非得嘴一下不可。
此外在某種意義上,任何在 80 歲前過世的人都算是英年早逝,因為那是平均值啊。#已經警告過了這回充滿這種超怪的發言
更怪的燒腦邏輯還有,如果說一個國家的預期壽命是 40 歲好了(約是古典希臘羅馬時期的數值),那 39 歲的人是否就該遺囑寫一寫準備投胎?答案是否,否,否,大大的否!他幾乎肯定可以再活個十年二十年沒事兒。
問題出在,古早年代的關卡,難關幾乎都在前頭。也就是古時小孩難養大,但一旦養大了日子就相對的平安。就有可能出現怪異的「活過一定歲數之後,預期壽命又增加」的現象,可以想成中位數和平均數拉開了。亦即是有大量早夭的幼童拉低了平均落水點(重心)的值,但幸運沒有在一開場就落水的人,就預期可以一直前進直到名為老化的障礙物襲來。
關於生命表,怪事和眉角肯定更多。寫到這邊留一個我觀察到但目前還想不通的事情,希望強者解答。那就是其實可以把每個年齡的人當作全新的參賽者,再計算他的預期餘命。假如 20 歲的人的預期餘命是 N 歲的話,直覺是那 21 歲人的預期餘命應該是 N-1 歲吧。實則不然,通常是一個 N-0.93 之類的數字。在高齡者更明顯,81 歲和 80 歲人的預期餘命只差 0.6 歲而已。
直觀上這似乎暗示每活過一歲,餘命會得到越來越多 bonus(系統訊息:恭喜恭喜)?! 這是為~什麼咧。一起想想看吧。
統計學平均數怎麼算 在 普通人的自由主義 Facebook 的最讚貼文
創業的離群值
如果我們要看個人平均財富,我們當然用中位數,不是用平均值,因為巨富如郭台銘,離群值太大,幾個人就把全國平均值拉得太高。這是統計學的基本概念,但我一直在想的問題是,有沒有什麼例子是相反的,得用平均值才對,用中位數反而會有偏差?
最近復習矽谷青年導師Paul Graham的文章,就看到一個絕佳的例子說明,平均值比中位數正確。年輕朋友有些都有創業的念頭,但是什麼樣的考量,讓你下定決心創業呢?除了做事業的渴望外,當然創業成功後的巨大報酬,也鼓舞著我們。而我們也知道,創業成功屬少數,所以我們也都有個衡量標準。也許標準在於,如果到一個大企業如台積電上班,我可以預期到的財富是什麼,對比的是,如果創業成功,可以預期的財富是什麼。兩相比較,取其大者,而做出決定。
Paul Graham的觀點在於,當你在衡量這兩者財富時,你要用的標準是平均值,而不是中位數。原因也正是在美國創業成功,帶來的財富是驚人的離群值,這離群值是你拿來估算期望值的數字,因為我們知道期望值來自平均數,而這驚人的離群值也正是為什麼年輕人該創業的原因。而且因為創業失敗的人何其多,如果你只比中位數,沒有人該創業,因為報酬看起來與風險一點都不相稱。
重點來了。創業不是買樂透,是有方法可尋的。年輕的時候,如果你可以忍受生活簡單、困苦,願意冒險,只要一試再試,那驚人的離群值,就不是小機率的事件,創業是fat-tail distribution,不是自然分佈!
所以年輕人該創業。但PG說的是美國,不是台灣。
以前的台灣是製造的台灣,也是世界的台灣。一個志在天下的青年如郭台銘,他找尋生命機會的抉擇是(A)一個船公司的工作,成功機率很大,但期望值沒有很高,或是(B)一個面向全世界的製造業創業,成功機率很小,但期望值超大,世界級的大。那這郭台銘,不選創業的話就是傻子,畢竟失敗了,也只是失去A的機會成本,損失也沒什麼。
但現在的台灣,已經不是世界的台灣。創業成功不但機率很小,期望值也不大。這樣就不難解釋為什麼我的前一代,甚至前半代,多的是大創業家,多的是不顧一切的冒險家,而我卻有一大半的大學同學在台積電和相關產業,過著穩定的中產階級生活。這是理性計算下,面對不一樣的台灣,所作的決定。這不是能力的差距,更不是什麼一代不如一代。
僅管如此,但那志在天下的青年,怎麼辦?
來,來美國,來求取巨大的成功。等我們成功了,衣錦還鄉,再來讓故鄉變成世界的台灣。