💥 20 個 #常見的統計錯誤,你犯過,或是犯了卻不知道嗎?⠀
⠀
MedCalc 的作者 Frank,在 Facebook 分享了一篇跟統計相關的文章,叫做「生物醫學研究文章中,連你都可以發現的 20 個統計錯誤」,很有意思。(連結請見原始貼文)
⠀
我(蔡依橙)認真看完後,覺得蠻不錯的,於是把這 20 個統計錯誤的標題翻成中文,協助大家節省時間,如果剛好有興趣的,可再針對該部分去閱讀原文。接著,分享一些我看完之後的想法。
⠀
⠀
1. 數值報告時,提供了不必要的精確。例如 60 公斤體重,硬要寫成 60.18 公斤。
⠀
2. 將連續變項分組,變成次序變項,但沒有說明為什麼這樣分。像是 CRP 不以數值去統計,而分成低、中、高三組,卻沒說明為什麼這樣分。
⠀
3. 配對資料,只報告各組平均,卻沒報告其改變。也就是只報告治療前血壓、治療後血壓,卻沒報告有多少人上升、多少人下降、平均下降多少。
⠀
4. 描述性統計的誤用,尤其該用 median (interquartile range) 的,硬是用成 mean +- SD。
⠀
5. 使用 standard error of the mean (SEM) 描述量測的精確度,而非 95% CI。
⠀
6. 只報告 p 值,卻沒提到差值以及臨床意義。
⠀
7. 誤用統計方式。尤其常見的是混淆有母數跟無母數統計方法。
⠀
8. 使用線性迴歸,卻沒有先確定資料之間是真的有線性關係。
⠀
9. 沒有使用全部的資料,然後又沒把去掉的資料「為什麼被去掉」說清楚。
⠀
10. 多組比較的 p 值校正問題。
⠀
11. 在隨機分組研究時,過於詳盡地比較了兩組受試者的基本資料,像是性別比例、年齡、體重、血壓等等,而且資料好得太奇怪。
⠀
12. 報告檢驗數值時,沒有定義 normal 與 abnormal。
⠀
13. 計算 sensitivity 與 specificity 時,沒有說明一些介在灰色地帶的檢查結果,如何呈現與去除。
⠀
14. 使用圖片與表格,只是為了儲存數據,而非以協助讀者理解為出發點。
⠀
15. 畫出來的數據圖,視覺主觀上給人的印象,竟然跟數據本身不同。
⠀
16. 在報告數據與解讀時,搞不清楚 units of observation 是什麼,例如心臟病的觀察研究,在 1000 個患者中有 18 位心臟病發,那 units of observation 就是 18。但如果這個研究是以診斷正確率為主,那 sample size 就是 1000。
⠀
17. 把不顯著的統計,或 low power,解讀成 negative,而非 inconclusive。
⠀
18. 分不清楚解釋性研究與實務性研究,前者為 explanatory / efficacy / laboratory,後者為 pragmatic / effectiveness / real world。嘗試兩種混著做,結果兩邊都做不好。
⠀
19. 沒有用臨床能理解的方式來報告最終結果。
⠀
20. 把統計的顯著性,當成臨床的重要性。例如:癌症用新藥治療,統計上很顯著的好,但追蹤了五年,患者只延長了七天的壽命。這就是統計有顯著,但臨床意義不大的例子。
⠀
⠀
🗨 我(蔡依橙)的一些想法
⠀
由統計專業人的角度,來看生物醫學發表,是很有警惕意義的,能讓準備發表的朋友,仔細看看自己是不是也犯了相關的錯誤。
⠀
但另一個角度看,作者也提到,這些錯誤在幾乎一半的生物醫學論文上反覆出現!這就代表,其實生物醫學論文要刊登,並不代表我們什麼錯都不能犯,相反地,這 20 個錯誤裡頭,有些就算犯了,也還是能被刊登。
⠀
以我們自己發表,以及過去協助同學的經驗來說,我會認為 2、7、10、14、15,是初學者也 #必須理解並避開的,其他的則是發表起步了之後,陸陸續續去注意,在往更高分期刊挑戰時,逐漸進步就行。
⠀
實務上,3 分以下的醫學期刊,幾乎沒有專門的統計查核,你只要能通過「一般同行」的統計知識審查就行。也就是說,我是一個放射科醫師,剛開始起步,投稿到放射科 3 分以下期刊,文章中的統計,只要「#一般有在做研究的放射科醫師」覺得可以就行,不見得要到「統計專家看過並挑不出毛病」。
⠀
對於初學者如何起步,實務的協助,新思惟規劃了各種類型的研究課程,歡迎有興趣的朋友可以參考。目前正在開放報名中的,有以下三場工作坊,歡迎您瞭解各課程的課綱後,評估挑選最符合您需求的內容,前來上課,讓我們協助您成功起步。
⠀
🟠 2021 / 11 / 7(日)統合分析工作坊
無經費、資源少也能發表,不用 IRB 且免收案的好選擇。
https://meta-analysis.innovarad.tw/event/
⠀
🔵 2021 / 10 / 17(日)臨床研究與發表工作坊
全新改款!跟著國際學者走,讓你寫作投稿都上手。
https://clip2014.innovarad.tw/event/
⠀
🟢 2021 / 10 / 16(六)個案報告、技術發表與文獻回顧工作坊
把臨床上的各種想法,在 PubMed 化作專業生涯上的里程碑。
https://casereport.innovarad.tw/event/
⠀ ⠀
不只是說說而已,我們會舉實例,說明其意義、如何避開,在互動實作過程,實際由各位在自己的電腦上操作,從數據到軟體,從統計到繪圖,一次搞定,並避開常見錯誤,是真正以 #初學者起步 為核心的規劃。
⠀
⠀
二十個常見的統計錯誤,與實務寫作時的考量。
🔗 原始貼文 │ https://bit.ly/2WESphu
「統計誤用例子」的推薦目錄:
- 關於統計誤用例子 在 蔡依橙的閱讀筆記 Facebook 的最佳解答
- 關於統計誤用例子 在 新思惟國際 Facebook 的精選貼文
- 關於統計誤用例子 在 每天努力Hack國家!士修的17時間 Facebook 的最佳解答
- 關於統計誤用例子 在 統計圖表的總結與誤用| Summary and Abuses of ... - YouTube 的評價
- 關於統計誤用例子 在 新思惟國際- 💥 20 個#常見的統計錯誤,你犯過 - Facebook 的評價
- 關於統計誤用例子 在 用jamovi上手統計學- 4 描述統計 的評價
- 關於統計誤用例子 在 常見的統計錯誤的在哪裡,FACEBOOK和Google我的地圖 的評價
統計誤用例子 在 新思惟國際 Facebook 的精選貼文
💥 20 個 #常見的統計錯誤,你犯過,或是犯了卻不知道嗎?⠀
⠀
MedCalc 的作者 Frank,在 Facebook 分享了一篇跟統計相關的文章,叫做「生物醫學研究文章中,連你都可以發現的 20 個統計錯誤」,很有意思。(連結請見原始貼文)
⠀
我(蔡依橙)認真看完後,覺得蠻不錯的,於是把這 20 個統計錯誤的標題翻成中文,協助大家節省時間,如果剛好有興趣的,可再針對該部分去閱讀原文。接著,分享一些我看完之後的想法。
⠀
⠀
1. 數值報告時,提供了不必要的精確。例如 60 公斤體重,硬要寫成 60.18 公斤。
⠀
2. 將連續變項分組,變成次序變項,但沒有說明為什麼這樣分。像是 CRP 不以數值去統計,而分成低、中、高三組,卻沒說明為什麼這樣分。
⠀
3. 配對資料,只報告各組平均,卻沒報告其改變。也就是只報告治療前血壓、治療後血壓,卻沒報告有多少人上升、多少人下降、平均下降多少。
⠀
4. 描述性統計的誤用,尤其該用 median (interquartile range) 的,硬是用成 mean +- SD。
⠀
5. 使用 standard error of the mean (SEM) 描述量測的精確度,而非 95% CI。
⠀
6. 只報告 p 值,卻沒提到差值以及臨床意義。
⠀
7. 誤用統計方式。尤其常見的是混淆有母數跟無母數統計方法。
⠀
8. 使用線性迴歸,卻沒有先確定資料之間是真的有線性關係。
⠀
9. 沒有使用全部的資料,然後又沒把去掉的資料「為什麼被去掉」說清楚。
⠀
10. 多組比較的 p 值校正問題。
⠀
11. 在隨機分組研究時,過於詳盡地比較了兩組受試者的基本資料,像是性別比例、年齡、體重、血壓等等,而且資料好得太奇怪。
⠀
12. 報告檢驗數值時,沒有定義 normal 與 abnormal。
⠀
13. 計算 sensitivity 與 specificity 時,沒有說明一些介在灰色地帶的檢查結果,如何呈現與去除。
⠀
14. 使用圖片與表格,只是為了儲存數據,而非以協助讀者理解為出發點。
⠀
15. 畫出來的數據圖,視覺主觀上給人的印象,竟然跟數據本身不同。
⠀
16. 在報告數據與解讀時,搞不清楚 units of observation 是什麼,例如心臟病的觀察研究,在 1000 個患者中有 18 位心臟病發,那 units of observation 就是 18。但如果這個研究是以診斷正確率為主,那 sample size 就是 1000。
⠀
17. 把不顯著的統計,或 low power,解讀成 negative,而非 inconclusive。
⠀
18. 分不清楚解釋性研究與實務性研究,前者為 explanatory / efficacy / laboratory,後者為 pragmatic / effectiveness / real world。嘗試兩種混著做,結果兩邊都做不好。
⠀
19. 沒有用臨床能理解的方式來報告最終結果。
⠀
20. 把統計的顯著性,當成臨床的重要性。例如:癌症用新藥治療,統計上很顯著的好,但追蹤了五年,患者只延長了七天的壽命。這就是統計有顯著,但臨床意義不大的例子。
⠀
⠀
🗨 我(蔡依橙)的一些想法
⠀
由統計專業人的角度,來看生物醫學發表,是很有警惕意義的,能讓準備發表的朋友,仔細看看自己是不是也犯了相關的錯誤。
⠀
但另一個角度看,作者也提到,這些錯誤在幾乎一半的生物醫學論文上反覆出現!這就代表,其實生物醫學論文要刊登,並不代表我們什麼錯都不能犯,相反地,這 20 個錯誤裡頭,有些就算犯了,也還是能被刊登。
⠀
以我們自己發表,以及過去協助同學的經驗來說,我會認為 2、7、10、14、15,是初學者也 #必須理解並避開的,其他的則是發表起步了之後,陸陸續續去注意,在往更高分期刊挑戰時,逐漸進步就行。
⠀
實務上,3 分以下的醫學期刊,幾乎沒有專門的統計查核,你只要能通過「一般同行」的統計知識審查就行。也就是說,我是一個放射科醫師,剛開始起步,投稿到放射科 3 分以下期刊,文章中的統計,只要「#一般有在做研究的放射科醫師」覺得可以就行,不見得要到「統計專家看過並挑不出毛病」。
⠀
對於初學者如何起步,實務的協助,新思惟規劃了各種類型的研究課程,歡迎有興趣的朋友可以參考。目前正在開放報名中的,有以下三場工作坊,歡迎您瞭解各課程的課綱後,評估挑選最符合您需求的內容,前來上課,讓我們協助您成功起步。
⠀
🟠 2021 / 11 / 7(日)統合分析工作坊
無經費、資源少也能發表,不用 IRB 且免收案的好選擇。
https://meta-analysis.innovarad.tw/event/
⠀
🔵 2021 / 10 / 17(日)臨床研究與發表工作坊
全新改款!跟著國際學者走,讓你寫作投稿都上手。
https://clip2014.innovarad.tw/event/
⠀
🟢 2021 / 10 / 16(六)個案報告、技術發表與文獻回顧工作坊
把臨床上的各種想法,在 PubMed 化作專業生涯上的里程碑。
https://casereport.innovarad.tw/event/
⠀ ⠀
不只是說說而已,我們會舉實例,說明其意義、如何避開,在互動實作過程,實際由各位在自己的電腦上操作,從數據到軟體,從統計到繪圖,一次搞定,並避開常見錯誤,是真正以 #初學者起步 為核心的規劃。
⠀
⠀
二十個常見的統計錯誤,與實務寫作時的考量。
🔗 原始貼文 │ https://bit.ly/2WESphu
統計誤用例子 在 每天努力Hack國家!士修的17時間 Facebook 的最佳解答
看到一篇熱門分享的貼文《一堂物理課,了解貧富差距的根源》,在某個經濟學社團引發激烈的學術(?)討論。合先敘明,我認為這位老師非常認真,很用心將物理學、經濟學和哲學連結起來。
Liou YanTing:一堂物理課,了解貧富差距的根源
https://www.facebook.com/permalink.php?story_fbid=3403616276360627&id=100001368650813
不過,將猜拳遊戲與氣體動力論胡亂連結,反而模糊了一些真正能套用的概念。在談論分配正義時,將財富自由分配簡化為貧富不均的對立,然後傾向政府需要介入。這是一種非常危險的「正義」,我不認同這叫做所謂「科學與人文的思辨之旅」。
※本篇附圖是網友提供:「沒有要酸的意思但我真的想到這張圖。」
Part 1
電容放電曲線呈指數衰減,放射線衰退曲線呈指數衰減,跟美國財富分配圖是不是有異曲同工之妙呢?紫外光殺菌的曲線也呈指數衰減,是不是跟猜拳遊戲還有財富分佈一樣呢?
這是典型的物理半調子。物理模型的相似性,來自數學模式的相似性,與物理現象無關。我最常舉的例子是,測不準定理來自波的數學性質,與量子力學無關的訊號波,也會有測不準定理,這些都可以用傅立葉分析推導。量子力學的意義在於賦予測不準定理另外的物理詮釋。
但我發現很多物理系學生誤以為測不準定理一定是量子力學的現象,甚至到研究所階段都不知道電機系做訊號對測不準的理解,搞不好比物理系更深刻。這是一種鄙視鏈和反鄙視鏈。
所以,文中的波茲曼分布,來自統計的數學性質,並不建立在氣體動力論之上。更何況,指數遞減現象在各種科學和工程領域都很常見,這是自然的數學模式。根據奧坎剃刀原則,你扯進氣體動力論,只是騙不懂物理的外行人,跟你一起誤解物理罷了。
只要某一現象符合「衰減速度與值成比例」性質,寫下數學式和解微分方程的結果,就必然出現指數衰減曲線。我認為這是數學程度40分就能理解,物理程度大概要60分,才不會被表象迷惑的性質。
數學系的訓練是提取抽象模式,但一般數學系學生沉迷於符號推演之美,不去思考真實問題。物理系的訓練是建構近似模型,但一般物理系學生時常忘記模型僅是近似,並且把數學模式的必然性誤理解為巧妙的真理。
這個我特別有感,因為我當年同時修數學系和物理系的課,花了很多時間掙扎兩邊做學問方法不相容。物理系學生大三修完量子物理,幾乎不會去思考波動力學為何與矩陣力學等價,對修過微分方程和線性代數的我卻是很自然的事,然而數學系學生卻大多不會碰觸量子力學,無從思考他們所學理論意義何在。
原文作者所犯的其實是物理系常見通病,連許多教授都無法倖免。由於缺乏對物理模型和數學模式的深刻理解,只由結果腦補關聯性,甚至把沒有物理意義的中間演算,硬套憑空想像的詮釋,美其名為物理圖像。我大學時期聽到這類似是而非的所謂「物理解釋」都覺得異常痛苦。
例如上述的指數衰減,如果你問一個成績優秀的物理系學生,他或許會列舉許多指數衰減的物理現象,並讚嘆物理規律的美妙。但能回答下一個問題的學生就少了,為什麼這些現象都呈指數衰減?
這問題其實很簡單,只要回到微分方程去看,它的本質是衰減速度與值成比例,凡是符合此性質,就必然得到指數衰減的數學規律。物理是參透自然的數學語言,對自然的理解,很大一部分取決於語言能力的掌握,即為我所強調的數學模式。
Part 2
對岸的知乎有一個討論串,更深入地探討了分配遊戲的模擬。
房间内有 100 人,每人有 100 块,每分钟随机给另一个人 1 块,最后这个房间内的财富分布怎样? - 知乎
https://www.zhihu.com/question/62250384
我覺得這篇文章沒什麼問題,你注意到他說隨機遊走相當於求解離散空間的熱傳導方程,這是將一個待解問題轉化為一個已知問題,純粹是數學模式的相似性,他沒有將隨機遊走的分布解,建立在熱力學物理之上。
貧富不均為穩定態,均富為非穩定態,其反直覺的思維誤區在於,「平均分布」僅是「穩定分布」的一種少見子集,絕大多數情況的「穩定分布」不是「平均分布」。例如,二項分布、常態分布,都不是人人均等。
說到底,「平均值」僅是平均後的一個值,常態分布以平均值為對稱,不代表區間每個值一定均等。
統計分布的穩定態,取決於機率密度函數的長相。你可以批評這個數據模擬,誤用熱力學模型解釋人類經濟現象,真實世界不存在完全隨機的交換行為等等。但這些批評並不到位。
因為它只是一個經濟行為的玩具模型(toy model),遊戲規則決定機率密度函數,進而決定穩定態的分布,算出來正好是狄利克雷分布。又恰巧與離散空間的熱傳導方程相似,則是後話。
我們也可以用一些物理的解釋。大多數人誤解了,物理的結果是「穩定態」,本來就不一定是「均等態」。在這個實驗之中,什麼條件會出現均等態?或許是每分鐘隨機分配給所有人自已手上所有的財產,能量的交換不加任何限制。
所以反過來想,遊戲規則限制了每分鐘隨機只能給另一個人1塊,當我因為機率的偶然,手上財產從100元掉到80元,我就更往破產的機率傾斜了。反之,我從100元變為120元,但下一回合我仍然只要給別人1塊,我的優勢就隨時間演化變大了。
我個人特別喜歡它後續做的「允許負債」模擬,以及「努力多1%競爭優勢」模擬,令人慶幸沒有出現反直覺的悲劇結果。自由競爭之下努力有意義,相當勵志,不是嗎?
經濟學的解釋,當然不能只是「要求平等均富的社會本身正是反自然的存在」,那僅僅只是「限定遊戲規則之下貧富不均是統計的穩定態」。
至於這個遊戲規則,離真實世界有多遠,當然很遠,但咱們學經濟的講機會成本。你不用這個遊戲規則,用另一個遊戲規則,會不會發生一樣的貧富不均結果?看起來很有可能會,但沒證據我不確定,有一說一才是科學精神。
或許在任何遊戲規則之下,只要不脫離「每分鐘隨機給出的數額有限制」的基本假設,都會跑出貧富不均的分布結果。而這個基本假設,在真實世界中也不可能捨棄,那麼這個數據模擬就有其參考價值。我們可以說,不論任何制度必然會有貧富不均的狀況出現,這才是最正常的現象。
參考閱讀:
巴斯夏的蠟燭工坊:今天臉書有一篇遭到瘋傳的經濟學相關文章,堪稱經濟學程度的照妖鏡
https://www.facebook.com/329896911051695/photos/a.358878471486872/642324269808956/?type=3
(我貢獻了 巴斯夏的蠟燭工坊 這篇文章的某些段落。)
統計誤用例子 在 新思惟國際- 💥 20 個#常見的統計錯誤,你犯過 - Facebook 的推薦與評價
描述性統計的誤用,尤其該用median (interquartile range) 的,硬是用成mean +- ... 誤用統計方式。 ... 這就是統計有顯著,但臨床意義不大的例子。 ... <看更多>
統計誤用例子 在 用jamovi上手統計學- 4 描述統計 的推薦與評價
以AFL勝隊得分的例子來說,最大值是116,最小值是0。儘管全距是所有變異量數裡計算方法最簡單,卻也是最不可靠的。還記得平均值的說明曾提到,統計量數最好要 ... ... <看更多>
統計誤用例子 在 統計圖表的總結與誤用| Summary and Abuses of ... - YouTube 的推薦與評價
... 內容:00:00 - 片頭00:17 - 統計 圖表總結| summary of statistical diagrams03:58 - 誤用統計 圖表的 例子 | examples of abuses of statistical d. ... <看更多>