รู้จักกับ Confidence Interval
Confidence Interval เป็นคอนเซปต์ที่คนทั่วๆ ไปมักจะรู้จักกันน้อยมาก ทั้งๆ ที่ในความเป็นจริงแล้ว มันเป็นคอนเซปต์ที่เราคุ้นเคยกันดีมาก และเราก็ใช้กันอยู่ทุกวันในชีวิตประจำวัน
วิทยาศาสตร์นั้นใช้ “คณิตศาสตร์” เป็นภาษาหลักในการสื่อสาร และเรามักจะวัด “ปริมาณ” ออกมาแทนเป็นตัวเลขเสมอ เวลาเราอ่านข่าว เรามักจะคุ้นเคยกับการรายงานตัวเลขเพียงตัวหนึ่ง แทนค่าอะไรสักอย่าง เอกภพมีอายุ 13.8 พันล้านปี โลกมีรัศมี 6,378 กม. ปริมาณ antibody ในกระแสเลือด คือ 9000 U/mL ฯลฯ ทั้งๆ ที่ความจริงแล้วในทางวิทยาศาสตร์เราจะไม่ได้วัดค่าเป็นตัวเลขเพียงตัวเดียว แต่จะเป็นช่วงตัวเลขช่วงหนึ่ง ที่เรียกว่า “Confidence Interval”
อาจารย์สอนวิชาเคมีวิเคราะห์ที่ผมเรียนด้วย ครั้งหนึ่งเคยพูดเอาไว้ ในประโยคแรก ของคาบเรียนแรกของวิชาว่า
“Every measurement is a lie, the difficulties come when you try to believe it”
“ทุกๆ การวัดก็คือการโกหก ปัญหามันอยู่ที่ว่าเราพร้อมจะเชื่อมันได้แค่ไหน”
ลองจินตนาการดูว่าเราไปซื้อหมูสับที่ตลาด แม่ค้าก็หยิบหมูมากำมือหนึ่ง น้ำหนัก(มวล)ที่แท้จริงของหมูสับนั้นเป็นเป็นค่าๆ หนึ่ง ซึ่งไม่มีใครหรือสิ่งใดในเอกภพที่จะสามารถทราบได้ สิ่งที่ตาชั่งของแม่ค้าบอกนั้นเป็นเพียงการ “ประมาณ” น้ำหนักของหมูชิ้นนั้นเท่านั้น
สมมติว่าตาชั่งนั้นบอกว่าหมูหนัก “สองขีด” แท้จริงแล้ว “สองขีด” นั้นไม่ใช่น้ำหนักที่แท้จริงของหมู แต่เป็นเพียงการประมาณค่าน้ำหนักจริงของเนื้อหมู ที่อยู่ระหว่างสองขีดบวกลบกับค่าความคลาดเคลื่อนที่ได้จากเครื่องมือ
ซึ่งความเป็นจริงแล้ว นี่ไม่ได้เป็นเพียงคอนเซปต์ในอุดมคติอันสวยหรู และเรื่องมากอะไรของนักวิทยาศาสตร์เพียงอย่างเดียว แต่เป็นสิ่งที่เราทุกคนใช้ และตกลงกันอยู่ในชีวิตประจำวัน
เพราะเวลาเราตกลงซื้อ “หมูสองขีด” กับแม่ค้า เราก็ไม่ได้มีความคาดหวังว่าจะต้องซูมเข้าไปดูเข็มว่ามันอยู่ที่ 200 กรัม กับอีกกี่มิลลิกรัม หรือไมโครกรัม เราอาจจะพอใจ และไม่ได้ติดใจอะไรกับแม่ค้า ตราบใดที่นน. ของหมูนั้นอยู่ในค่าที่ “ยอมรับได้” ซึ่งสำหรับหมูสองขีดนี้อาจจะอยู่ในขอบเขต 150-250 กรัม (ขีดครึ่งถึงสองขีดครึ่ง) ก็ยังไม่น่าเกลียดอะไรมาก (เว้นเสียแต่คุณจะเป็นทนายความหัวหมอคนหนึ่งในเมืองเวนิส)
นั่นหมายความว่า เวลาเราบอกกันว่า “หมูสองขีด” แท้จริงแล้วเรากำลังบอกว่า “ตั้งแต่ขีดครึ่งกว่าๆ ไปจนถึงสองขีดครึ่ง” หรือเวลาเราบอกว่าเราใช้เวลาสองชม. เดินทางกลับบ้าน เราไม่ได้หมายความว่า “สองชั่วโมง ศูนย์นาที ศูนย์วินาที ศูนย์มิลลิวินาที” ไม่ขาดไม่เกิน แต่เราหมายความว่า “ระหว่าง ชั่วโมงนิดๆ ไปถึงเกือบสามชม”
ซึ่งไอ้ “ขอบเขตที่ยอมรับได้” นี่เอง ที่เกี่ยวข้องกับ “Confidence Interval” และมีความเกี่ยวข้องกับ “เลขนัยะสำคัญ” เพราะมันเป็นตัวบอกว่าเรา "พร้อมที่จะเชื่อคำโกหกนั้นแค่ไหน" เช่น คนที่บอกว่าใช้เวลากลับบ้าน “สองชั่วโมง” นั้นกำลังพยายามสื่อถึงขอบเขตที่ยอมรับได้ ที่แตกต่างจากผู้ที่บอกว่าใช้เวลากลับบ้าน “หนึ่งชั่วโมง สี่สิบเจ็ดนาที” เพราะเราคงไม่จำเป็นต้องระบุว่าสีสิบเจ็ดนาที ถ้าเราไม่ได้มั่นใจในหลักนาทีที่สำคัญขนาดนั้น
และนี่เป็นเหตุผลว่าทำไมเราจึงไม่ควรจะอ่านตัวเลขทุกหลักที่ได้จากเครื่องคิดเลข เช่น ป้ายยอดดอยอินทนนท์เขียนเอาไว้ว่าดอยอินทนน์มีความสูงจากระดับน้ำทะเล 2,565.3341 เมตร (เขียนงี้จริงๆ ไม่เชื่อลองไปดู) ซึ่งการระบุความแม่นยำไปถึงหลัก 0.1 มิลลิเมตรนั้นสื่อว่าความสูงที่วัดได้นี่นั้นแม่นยำยิ่งกว่าความสูงของเม็ดทรายหนึ่งเม็ด ซึ่งเป็นไปไม่ได้ (คือแค่คนวัดยืนหายใจความสูงก็เปลี่ยนไปมากกว่าทศนิยมที่เขากล่าวอ้างแล้ว)
ซึ่งในทางวิทยาศาสตร์นั้นก็ใช้หลักการเดียวกัน แต่เรามีการระบุให้รัดกุมไปกว่านั้น โดยเราจะบอกเป็น Confidence Interval ควบคู่ไปกับเปอร์เซ็นต์ความน่าเชื่อถือของขอบเขตนั้น หรือที่เรียกกันว่า Confidence Level หรือ "เรามั่นใจแค่ไหน ว่าคำตอบนั้นอยู่ในขอบเขตที่เราระบุเอาไว้"
เราสามารถนึกถึง Confidence Level ง่ายๆ โดยการจินตนาการแบบนี้ “สมมติว่าเราต้องวางเงินเดิมพันว่าค่าของเขตที่เรารายงานนั้นครอบคลุมไปถึงค่าที่แท้จริง เราจะกล้าเดิมพันแค่ไหน” แน่นอนว่าเราไม่มีวันมั่นใจได้ “100%” แต่หากเราพูดถึงการเดิมพัน ยิ่งเรามั่นใจมาก เราก็อาจจะยอมที่จะเดิมพันที่เสี่ยงมากขึ้น เช่น หากเรามั่นใจว่าเราจะถูกถึงมากกว่า 95% ต่อให้เดิมพันเสียเปรียบ 1 ต่อ 20 ก็ยังนับเป็นการลงทุนที่คุ้มค่าที่จะเสี่ยง
ดังนั้นค่าทุกค่าที่รายงานในทางวิทยาศาสตร์ นั้นจะมีอยู่สองส่วนเสมอ (ไม่ว่าจะละเอาไว้ในฐานที่เข้าใจหรือไม่ก็ตาม) นั่นก็คือเปอร์เซนต์ความเชื่อมั่น ว่าผู้รายงานมีความเชื่อมั่นในตัวเลขนี้เท่าใด และช่วงขอบเขตของตัวเลขที่สอดคล้องกับเปอร์เซนต์ความเชื่อมั่นเท่านั้น
ซึ่งยิ่งเราระบุขอบเขตให้กว้างเท่าไหร่ก็จะยิ่งมีโอกาสที่ค่าจริงจะอยู่ในขอบเขตนั้นมากขึ้นเพียงเท่านั้น เราอาจจะไม่มั่นใจเท่าไหร่ว่าหมูชิ้นนี้จะมีน้ำหนักระหว่าง 199.999 กรัมไปจนถึง 200.001 กรัม แต่เรามั่นใจค่อนข้างมากว่า น้ำหนักน่าจะอยู่ระหว่าง 100-300 กรัม และเรามั่นใจล้านเปอร์เซ็นต์ ว่าน้ำหนักของหมูนั้นมากกว่าศูนย์ แค่น้อยกว่ามวลของเอกภพ (แต่ขอบเขตที่ได้จากความมั่นใจเว่อร์ระดับนี้นั้นอาจจะไม่ได้มีความหมายเสียเท่าไหร่)
เช่น นักวิทยาศาสตร์ที่ชั่งสารอาจจะบอกว่า ตัวอย่างนี้มีมวล 200.0 +/- 0.2 g with 95% Confidence Interval รัศมีของโลกมีระยะทาง 6.3781366 +/- 1 x10^6 m ซึ่งยิ่งเครื่องมือมีความแม่นยำเพียงใด เราอาจจะยิ่งได้ขอบเขตของความน่าเชื่อถือที่แคบเท่านั้น แต่เราไม่มีวันที่จะสามารถหาน้ำหนักหรือรัศมี “ที่แท้จริง” เป๊ะๆ ได้เลย เราได้แต่เพียงทำให้ขอบเขตเล็กลงเรื่อยๆ
นอกจากความแม่นยำของเครื่องมือแล้ว อีกปัจจัยหนึ่งก็คือเรื่องของ “สถิติ” เช่น หากเราทำการสำรวจน้ำหนักของประชากรชาวไทย เราจะพบว่าน้ำหนักแต่ละคนนั้นมีการกระจายตัวออก และไม่เท่ากัน เราก็จะใช้ Confidence Interval และ Confidence Level ในการรายงานค่าที่เป็นตัวแทนของประชากรนี้ได้เช่นกัน ว่าเรามีความมั่นใจเพียงใด ว่าค่าที่แท้จริงจะอยู่ในขอบเขตนี้ แน่นอนว่าในประชากรที่มีค่าที่แตกต่างกันมาก ขอบเขตของความเชื่อมั่นย่อมที่จะกระจายตัวได้กว้างเป็นธรรมดา
ซึ่งการรายงาน Confidence Interval ที่ไม่สอดคล้องกับข้อมูล แน่นอนว่าเทียบเท่ากับการ “บิดเบือนความจริง” เพราะเรากำลังจะบอกว่าเรามั่นใจว่าค่าจริงนั้นอยู่ในช่วงนี้ ทั้งๆ ที่ความเป็นจริงแล้วข้อมูลไม่ได้บ่งชี้เช่นนั้นเลย
เช่น หากเรามีข้อมูลเพียงสองจุด แต่เรากลับแทนค่า Confidence Interval ด้วย “พิสัย” ของข้อมูล (ดังภาพ) เท่ากับเรากำลังบอกว่าข้อมูลที่เราวัดเพียงสองครั้งนั้น ได้สะท้อนถึงขอบเขตบน และขอบเขตล่างของค่าจริงเป็นที่เรียบร้อยแล้ว และเท่ากับเป็นการบ่งชี้ว่าเรามีความเชื่อมั่นว่าในการวัดครั้งถัดไป เราจะได้ค่าที่อยู่ระหว่างสองครั้งแรกที่วัดอย่างแน่นอน เปรียบเทียบได้กับการอ้างว่า เพียงสองครั้งที่เราวัดนั้น เราได้บังเอิญสุ่มได้ค่าที่มากที่สุด และน้อยที่สุดไปโดยบังเอิญภายในสองครั้งแรกที่ทำการวัด
หากเปรียบเทียบ ก็เปรียบได้กับการทอยลูกเต๋าที่เราไม่ทราบว่ามีกี่ด้าน และมีตัวเลขเท่าใดบ้างสองครั้ง ได้เลข 4 กับเลข 6 แล้วเราก็สรุปว่าค่าส่วนมากที่เต๋าลูกนี้จะทอยได้นั้น จะอยู่ระหว่าง 4 ถึง 6
เราอาจจะคิดว่า การโกหกข้อมูลมันทำได้เฉพาะการรายงานค่าเฉลี่ยที่ไม่ตรงตามความเป็นจริง แต่ในความเป็นจริงแล้วนั้น อย่างที่บอกไปแล้วว่าข้อมูลทางวิทยาศาสตร์นั้นมีทั้งเปอร์เซ็นต์ความน่าเชื่อถือ กับขอบเขตตัวเลข ซึ่งแม้ว่าเราจะรายงานค่าเฉลี่ยถูกต้อง แต่หากเรารายงานความน่าเชื่อถือ หรือขอบเขตที่ผิดไป (หรือไม่รายงาน) เราก็สามารถทำให้คนอ่านเข้าใจผิดได้เช่นกัน เช่นข้อมูลที่ไม่มีความน่าเชื่อถือ แต่แอบอ้างให้คนอ่านเข้าใจว่ามีความน่าเชื่อถือสูงกว่าที่ควรจะเป็น หรือการทำให้ขอบเขตแคบกว่าที่คิด (โดยการเลือกความน่าเชื่อถือที่ต่ำลง เป็นต้น) ก็อาจทำให้เข้าใจผิดเกี่ยวกับข้อมูลได้เช่นกัน
เช่น หากดูค่าเฉลี่ยเปรียบเทียบแล้วเราอาจจะพบว่าข้อมูลชุดหนึ่งมีค่าเฉลี่ยสูงกว่า แต่หากเราพิจารณาขอบเขตที่ 95% CI แล้วเราจะพบว่าข้อมูลส่วนมากมีความคาบเกี่ยวกันเสียส่วนมาก ทำให้ข้อสรุปที่ได้ควรจะเป็นว่าสองข้อมูลนี้ไม่มีความแตกต่างกันอย่างมีนัยะสำคัญ แต่หากเราเปลี่ยนไปเลือก 65% CI เราอาจจะพบว่าขอบเขตที่น่าเชื่อถือของข้อมูลทั้งสองนั้นแยกจากกันมากขึ้น เราอาจทำให้ผู้อ่านเข้าใจผิดไปว่าข้อมูลทั้งสองนั้นแตกต่างกันมากกว่าที่ควรจะเป็น
ซึ่งแน่นอนว่านี่ไม่ใช่หลักการทางสถิติที่ควรจะเป็น
ป.ล. หลังจากที่หลายๆ คนทักมา และดูเพิ่มเติมแล้ว เข้าใจว่า “ที่มา” ของกราฟ n=2 จะใช้ Interquartile range Q1 Q3 แทนนะครับ ซึ่งเนื่องจากข้อมูลมีไม่พอ เลยถูกปัดไปเป็น min/max โดยปริยาย ซึ่งแม้ว่า IQR จะมีความหมายแตกต่างจาก CI พอสมควร แต่โดยหลักการที่ข้อมูลไม่ได้แสดงแทนด้วยเลขตัวเดียว แต่แทนถึงประชากรที่มีความหลากหลาย ก็ไม่ได้แตกต่างกันมากครับ
「confidence level confidence interval」的推薦目錄:
confidence level confidence interval 在 賭Sir(杜氏數學) Facebook 的精選貼文
你考完 mock,學校老師畀你嘅 predicted grade 係「U 至 5**」,你滿唔滿意?🙂
「梗係唔滿意啦!鬼唔知阿媽係女人咩?U 至5 ** 洗鬼佢 predict 呀?」🌚
呢啲時候,賭 Sir 最鍾意包拗頸:
「點解唔滿意?但係我有【99% 信心】佢個 predicted grade 係講中!咁靈都唔滿意?」
-----------
係咪覺得有啲唔妥?但係又好似講唔出有咩唔妥?等我講你知:
其實,我哋除咗渴望一個預測要夠「準繩」之外,仲渴望佢夠「精確」。
舉個例:
例一:準繩 ✅、精確❌——預測賭 Sir 拎「U至5**」裏面其中一個 grade
例二:準繩 ❌、精確✅——預測賭 Sir 拎「95.432%」嘅得分
例三:準繩 ✅、精確✅——預測賭 Sir 拎「5**」
-----------
套返落去 M 1嘅 concepts,我哋對 prediction 有 2 個要求:
1️⃣ 要準繩!即係 confidence level 要高
2️⃣ 要精確!即係 confidence interval 要窄
言歸正傳,若然要縮窄 confidence interval、即係想精確嘅話,第一個方法當然係「放棄準繩」,好似例二咁,亂咁 up 啲好精確嘅嘢,喺件事發生之前有咁仔細、講咁仔細,反正未發生,只要厚面皮大膽講,就可以 draw 到好多 attention,依家香港好多 KOL 都係咁搵食,歡迎自行對號入座😌
當然,如此「降低 confidence Level 以換取 narrow confidence interval」嘅策略,係一個好唔負責任嘅方法啦!咁有冇兩全其美嘅方法呢?🤤
有🤩 就係增加 sample size。用返你考 mock 嘅例子,就係要你考多好多個 mock!!!易明吖~越考得多,就越能夠反映出你嘅真正實力嘛!自然就越容易作出「準繩+精確」嘅預測。而用返你教科書啲公式,就係令分母嘅 n 上升,縮窄 confidence Interval。
不過,增加 sample size 有金錢成本 + 時間成本,所以唔能夠無止境地增加🤥 而「假設」你真係能夠無限量增加 sample size,令到 n 變成無限,你望下條公式,分母變咗無限,即係個 confidence interval 嘅 width 變埋 0,令 prediction 完全準繩,又完全精確啦!
邊個可以做到?上帝囉!或者,你都得!🥳 只要你能夠預先知道咗一件事,甚至呢件事就係由你控制,然後喺其他人面前扮預測,得咗!社會上好多人都係咁做,局中人揸住內幕料,對住公眾扮預測,咁梗係又準繩又精確啦!😍
---------
#M1解題王 會以題目 keyword 切入,同你極速 KO M1 題目;記住 Save 低個 post,方便你大考前攞出嚟溫🔥
------------
🎲賭Sir|高階數學考試專家
🎓21 項數學公開試.以一 Take 過考取完美戰績
DSE:Math+M1+M2【5**】
CE & AL:Math+A.Math+Pure+Applied【A】
IAL:C12+C34+F1+F2+F3+M1+M2+M3+S1+S2+S3+D1【A】
IGCSE:Mathematics+Further Pure Mathematics 【9】
🖥最高人氣補習網紅・貼地教數別樹一格
頻道 #杜氏數學 2016年創辦,訂閱65,000+,多條教學影片點擊100,000+;2018年獲出版社邀請,撰寫暢銷書《5**數學男人嫁得過》推廣「聰明應試」理念,並鼓勵年青人堅守自信。
🧠以心理學、高效學習融入補習教育當中
從中文大學風險管理學士畢業之後,鑽研超速學習法(Ultralearning)及教育心理學,將高效學方法先行用於自己身上,無間斷學習新知識;四年後重返校園,完成中文大學數學碩士(大數據分析)課程,期間考入門薩學會(Mensa),實證超速學習法。
🏆座右銘
好多人以為自己因為對數學無興趣,所以數學低分;事實剛好相反:因為自己數學低分,所以對數學無興趣。試諗下,若然你有歌神嘅聲線,你仲會對唱歌無興趣嗎?
------------
#數學 #DSE #dser #math #maths #afterschool #dsemath #examskills #mathtutor #followme #2021DSE #2022DSE #2023DSE #tutor #mathtutor #DSEfighter #tutotial
confidence level confidence interval 在 Confidence interval - Wikipedia 的相關結果
In statistics, a confidence interval (CI) is a range of estimates for an unknown parameter, defined as an interval ... ... <看更多>
confidence level confidence interval 在 Interpreting confidence levels and confidence intervals - Khan ... 的相關結果
The confidence level refers to the long-term success rate of the method, that is, how often this type of interval will capture the parameter of interest. A ... ... <看更多>
confidence level confidence interval 在 What is the difference between a confidence interval and a ... 的相關結果
The confidence level is the percentage of times you expect to get close to the same estimate if you redo your test. The confidence interval is the upper and ... ... <看更多>