Phần tư là gì?
Phần tư là một thuật ngữ thống kê mô tả sự phân chia các quan sát thành bốn khoảng xác định dựa trên các giá trị của dữ liệu và cách chúng so sánh với toàn bộ các quan sát.
Hiểu về bộ tứ
Để hiểu được phần tư, điều quan trọng là phải hiểu trung vị là thước đo của xu hướng trung tâm. Giá trị trung bình trong thống kê là giá trị trung bình của một tập hợp số. Đó là điểm mà chính xác một nửa dữ liệu nằm bên dưới và bên trên giá trị trung tâm.
Vì vậy, với một bộ gồm 13 số, trung vị sẽ là số thứ bảy. Sáu số trước giá trị này là các số thấp nhất trong dữ liệu và sáu số sau trung vị là các số cao nhất trong tập dữ liệu được cung cấp. Bởi vì trung vị không bị ảnh hưởng bởi các giá trị cực đoan hoặc ngoại lệ trong phân phối, nên đôi khi nó được ưa thích hơn so với giá trị trung bình.
Trung vị là một công cụ ước tính mạnh mẽ về vị trí nhưng không nói gì về cách dữ liệu ở hai bên giá trị của nó được lan truyền hoặc phân tán. Đó là nơi các bộ tứ bước vào. Bộ tứ đo lường sự lan truyền của các giá trị trên và dưới giá trị trung bình bằng cách chia phân phối thành bốn nhóm.
Chìa khóa chính
- Phần tư đo lường sự lan truyền của các giá trị trên và dưới giá trị trung bình bằng cách chia phân phối thành bốn nhóm. Phần tư chia dữ liệu thành ba điểm - phần tư thấp hơn, trung vị và phần tư trên - để tạo thành bốn nhóm của tập dữ liệu. để tính toán phạm vi liên vùng, đó là thước đo độ biến thiên xung quanh trung vị.
Bộ tứ hoạt động như thế nào
Giống như trung vị chia dữ liệu thành một nửa sao cho 50% số đo nằm dưới trung vị và 50% nằm trên nó, phần tư chia dữ liệu thành các phần sao cho 25% số đo nhỏ hơn phần tư thấp hơn, 50 phần trăm % thấp hơn giá trị trung bình và 75% thấp hơn nhóm trên.
Một phần tư chia dữ liệu thành ba điểm - một phần tư thấp hơn, trung vị và phần tư trên - để tạo thành bốn nhóm của tập dữ liệu. Phần tư thấp hơn hoặc phần tư thứ nhất được ký hiệu là Q1 và là số ở giữa nằm giữa giá trị nhỏ nhất của tập dữ liệu và trung vị. Phần tư thứ hai, Q2, cũng là trung vị. Phần tư trên hoặc phần ba, ký hiệu là Q3, là điểm trung tâm nằm giữa trung vị và số cao nhất của phân phối.
Bây giờ, chúng ta có thể vạch ra bốn nhóm được hình thành từ các phần tư. Nhóm giá trị đầu tiên chứa số nhỏ nhất lên tới Q1; nhóm thứ hai bao gồm Q1 đến trung vị; bộ thứ ba là trung vị đến quý 3; loại thứ tư bao gồm quý 3 đến điểm dữ liệu cao nhất của toàn bộ tập hợp.
Mỗi phần tư chứa 25% tổng số quan sát. Nói chung, dữ liệu được sắp xếp từ nhỏ nhất đến lớn nhất:
- Phần tư thứ nhất: 25% số thấp nhất Phần tư thứ hai: từ 25, 1% đến 50% (tính đến trung vị) Phần tư thứ ba: 51% đến 75% (trên trung vị) Phần tư thứ tư: 25% số cao nhất
Ví dụ tứ phân vị
Hãy làm việc với một ví dụ. Giả sử, sự phân phối điểm toán trong một lớp gồm 19 học sinh theo thứ tự tăng dần là:
59, 60, 65, 65, 68, 69, 70, 72, 75, 75, 76, 77, 81, 82, 84, 87, 90, 95, 98
Đầu tiên, đánh dấu xuống trung vị, Q2, trong trường hợp này là giá trị thứ mười: 75.
Q1 là điểm trung tâm giữa điểm nhỏ nhất và trung vị. Trong trường hợp này, Q1 rơi vào giữa điểm số thứ nhất và thứ năm: 68..
Q3 là giá trị trung bình giữa Q2 và điểm cao nhất: 84..
Bây giờ chúng ta có các phần tư của chúng ta, hãy giải thích số của chúng. Điểm số 68 (Q1) đại diện cho phần tư thứ nhất và là phần trăm thứ 25. 68 là trung vị của nửa dưới của điểm được đặt trong dữ liệu có sẵn, tức là trung vị của điểm từ 59 đến 75.
Q1 cho chúng ta biết rằng 25% số điểm dưới 68 và 75% số điểm của lớp là lớn hơn. Q2 (trung vị) là phân vị thứ 50 và cho thấy 50% số điểm thấp hơn 75 và 50% số điểm trên 75. Cuối cùng, Q3, phân vị thứ 75, cho thấy 25% số điểm là lớn hơn và 75% là ít hơn 84.
Cân nhắc đặc biệt
Nếu điểm dữ liệu cho Q1 nằm xa trung vị hơn so với Q3 là từ trung vị, thì chúng ta có thể nói rằng có sự phân tán lớn hơn giữa các giá trị nhỏ hơn của tập dữ liệu so với các giá trị lớn hơn. Logic tương tự được áp dụng nếu Q3 cách xa Q2 hơn Q1 so với trung bình.
Ngoài ra, nếu có số điểm dữ liệu chẵn, trung vị sẽ là trung bình của hai số ở giữa. Trong ví dụ của chúng tôi ở trên, nếu chúng tôi có 20 học sinh thay vì 19, điểm trung bình của điểm số của chúng sẽ là trung bình số học của số thứ mười và thứ mười một.
Các phần tư được sử dụng để tính toán phạm vi liên vùng, đây là thước đo độ biến thiên xung quanh trung vị. Phạm vi giữa các phần được tính đơn giản là sự khác biệt giữa phần tư thứ nhất và phần thứ ba: Q3 - Q1. Trong thực tế, đó là phạm vi của nửa giữa của dữ liệu cho thấy mức độ lan truyền của dữ liệu.
Đối với các tập dữ liệu lớn, Microsoft Excel có chức năng QUARTILE để tính toán các phần tư.
