การคิดค่าเปอร์เซ็นต์ไทล์ 50 หรือ median มันคิดแบบนี้จริงๆเหรอครับ

อาจารย์สอนมาว่า การคิดค่าเปอร์เซ็นต์ไทด์ของข้อมูลที่ไม่แจกแจงความถี่ให้คิดตามสูตรนี้
Pr = r/100 x (N + 1) โดย N คือจำนวนข้อมูลทั้งหมด
ถ้ามีข้อมูลเรียงเบอร์ตั้งแต่ 1, 2, 3, ..., 98, 99, 100
ข้อมูล N จะเป็น 100 (เพราะมี 100 ข้อมูล)
แล้ว P50 = 0.5*(101) = ตำแหน่งที่ 50.5
ซึ่งในกรณีนี้คือ 50.5
แต่ในความเป็นจริงถ้ามีข้อมูล 100 ข้อมูลแบบนี้พอดี ตำแหน่งข้อมูลที่น้อยกว่าหรือเท่ากับ 50% ของข้อมูลมันคือ 50 พอดีไม่ใช่เหรอครับ
ทำไมการคำนวณถึงไปตอบว่า 50.5

อีกตัวอย่งที่ชัดคือ ถ้ามีข้อมูลเป็นคะแนนสอบของนักเรียน 5 คนดังนี้ 1, 2, 3, 4, 5
N = 5
ถามว่าคนที่ได้ 1 คะแนน อยู่ Percentile ที่เท่าไหร่ ก็ตอบว่า 20% เห็นๆ
คนที่ได้ที่ 2 ก็ 40%
คนที่ได้ที่ 3 ก็ 60% ไม่ใช่ 50% เพราะมี 60% ของข้อมูลน้อยกว่าหรือเท่ากับ 3
ไปเรื่อยๆจนที่ถึง คนที่ 5 ก็ 100%

คำถามคือสูตรที่อาจารย์สอนๆกันผิดหรือป่าวครับ....
แสดงความคิดเห็น
โปรดศึกษาและยอมรับนโยบายข้อมูลส่วนบุคคลก่อนเริ่มใช้งาน อ่านเพิ่มเติมได้ที่นี่