ตัวแปรที่ใช้ในทางสถิติตัวหนึ่งย่อมมีค่า เช่น X1 คือความสูงของนักเรียนคนหนึ่ง
มีค่าเท่ากับ 155 เซนติเมตร ถ้าค่าของความสูงของนักเรียนที่เป็นตัวแทน n คน
ย่อมมีความแตกต่าง มีตั้งแต่เตี้ยสุดไปยังสูงสุด การกระจายข้อมูลของตัวแปรมีคุณลักษณะแตกต่างกัน
ลักษณะการกระจายอาจเขียนเป็นรูปกราฟได้
การปรากฎมาก น้อย เรียกว่าความถี่ ในทางสถิติถือเป็นความน่าจะเป็นเช่นกัน
เช่น ความสูงปานกลางของนักเรียนในชั้นมัธยมปีที่ 1 อยู่ที่ 160-165 เซนติเมตร
ช่วงความสูงนี้มีทั้งสิ้น 30 คน จาก 100 คน จะเห็นว่าค่าที่เกิดขึ้นในเรื่องความถี่
คือ มีจำนวนคนที่มีค่าข้อมูลอยู่ในช่วงนี้มีกี่คน หรือ.ดูในรูปของความน่าจะเป็นได้
ค่าความสูงเฉลี่ยปานกลางอยู่ที่ 152 เซนติเมตร
เราใช้
แทนค่าเฉลี่ย
แต่ค่า
นี้เป็นค่าเฉลี่ยที่ใช้สำหรับตัวแทน
(sample)
แต่สำหรับประชากรแล้วเราใช้
(มิว)
แทนค่าเฉลี่ยของประชากร
ดังนั้น
และ จึงมีความหมายที่แตกต่างกัน |
ตัวอย่าง เช่น เมื่อเราโยนลูกเต๋า โดยให้ลูกเต๋ามีค่าเป็น 1,2,3,4,5,6
ตามหน้าที่ออก หากพิจารณาค่าเฉลี่ยของตัวเลขที่เกิดจากการโยนลูกเต๋า โดยพิจารณาจากประชากรทั้งหมดซึ่งค่าเฉลี่ยนี้
คือ
แต่ถ้าเราโยนลูกเต๋าเองในลักษณะเพื่อการทดลองหรือทำเป็น sample ซึ่งก็คือตัวแทน
โดยมีการโยน 5 ครั้งผลที่ได้ คือ 2,1,5,3,4,3 เมื่อนำมาหาค่าเฉลี่ยได้
จะเห็นว่า
ไม่เท่ากับ  |
และจากข้อมูลความกระจายเราอาจได้ตัวเลข
เช่นความเป็นไปได้ของนักเรียนที่มีความสุงเกิน 162 เซนติเมตรมี 0.5 เป็นต้น
ที่มา : รศ. ยืน ภู่วรวรรณ, สำนักบริการคอมพิวเตอร์ มหาวิทยาลัยเกษตรศาสตร์