Phân phối lấy mẫu là gì?
Phân phối mẫu là phân phối xác suất của một thống kê thu được thông qua một số lượng lớn các mẫu được rút ra từ một dân số cụ thể. Phân phối lấy mẫu của một dân số nhất định là phân phối tần số của một loạt các kết quả khác nhau có thể xảy ra đối với một thống kê của dân số.
Hiểu phân phối lấy mẫu
Rất nhiều dữ liệu được rút ra và sử dụng bởi các học giả, nhà thống kê, nhà nghiên cứu, nhà tiếp thị, nhà phân tích, vv thực sự là các mẫu, không phải là dân số. Một mẫu là một tập hợp con của dân số. Ví dụ, một nhà nghiên cứu y học muốn so sánh trọng lượng trung bình của tất cả trẻ sơ sinh được sinh ra ở Bắc Mỹ từ năm 1995 đến năm 2005 với những người sinh ra ở Nam Mỹ trong cùng một khoảng thời gian có thể rút ra dữ liệu cho toàn bộ dân số hơn một triệu ca sinh nở xảy ra trong khung thời gian mười năm. Thay vào đó, anh ta sẽ chỉ sử dụng trọng lượng của 100 em bé ở mỗi châu lục để đưa ra kết luận. Trọng lượng của 200 em bé được sử dụng là mẫu và trọng lượng trung bình tính là trung bình mẫu.
Bây giờ giả sử rằng thay vì chỉ lấy một mẫu gồm 100 trọng lượng sơ sinh từ mỗi lục địa, nhà nghiên cứu y học lấy các mẫu ngẫu nhiên lặp lại từ dân số nói chung và tính toán trung bình mẫu cho mỗi nhóm mẫu. Vì vậy, đối với Bắc Mỹ, ông đã thu thập dữ liệu cho 100 trọng lượng sơ sinh được ghi nhận ở Mỹ, Canada và Mexico như sau: bốn mẫu 100 từ các bệnh viện được chọn ở Mỹ, tổng cộng 70 mẫu từ Canada và ba hồ sơ từ Mexico 1200 trọng lượng của trẻ sơ sinh được nhóm trong 12 bộ. Ông cũng thu thập dữ liệu mẫu của 100 trọng lượng sơ sinh từ mỗi trong số 12 quốc gia ở Nam Mỹ.
Mỗi mẫu có ý nghĩa mẫu riêng và phân phối của phương tiện mẫu được gọi là phân phối mẫu.
Trọng lượng trung bình được tính cho mỗi bộ mẫu là phân phối mẫu của giá trị trung bình. Không chỉ có thể tính trung bình từ một mẫu. Các thống kê khác, chẳng hạn như độ lệch chuẩn, phương sai, tỷ lệ và phạm vi có thể được tính từ dữ liệu mẫu. Độ lệch chuẩn và phương sai đo lường mức độ biến thiên của phân phối mẫu.
Số lượng quan sát trong một quần thể, số lượng quan sát trong một mẫu và quy trình được sử dụng để vẽ các bộ mẫu xác định độ biến thiên của phân phối mẫu. Độ lệch chuẩn của phân phối mẫu được gọi là sai số chuẩn. Mặc dù giá trị trung bình của phân phối mẫu bằng với giá trị trung bình của dân số, sai số chuẩn phụ thuộc vào độ lệch chuẩn của dân số, kích thước của dân số và kích thước của mẫu.
Việc biết mức độ phân tán trung bình của từng bộ mẫu là khác nhau và từ trung bình dân số sẽ cho biết mức độ trung bình của mẫu có ý nghĩa với dân số. Lỗi tiêu chuẩn của phân phối lấy mẫu giảm khi kích thước mẫu tăng.
Cân nhắc đặc biệt
Một quần thể hoặc một bộ số mẫu sẽ có phân phối bình thường. Tuy nhiên, vì phân phối lấy mẫu bao gồm nhiều bộ quan sát, nên nó sẽ không nhất thiết phải có hình dạng cong hình chuông.
Theo ví dụ của chúng tôi, trọng lượng trung bình dân số của trẻ sơ sinh ở Bắc Mỹ và Nam Mỹ có phân phối bình thường vì một số trẻ sẽ bị thiếu cân (dưới mức trung bình) hoặc thừa cân (trên trung bình), với hầu hết trẻ sơ sinh rơi vào giữa (khoảng trung bình). Nếu trọng lượng trung bình của trẻ sơ sinh ở Bắc Mỹ là bảy pound, thì trọng lượng trung bình của mẫu trong mỗi 12 bộ quan sát mẫu được ghi nhận ở Bắc Mỹ cũng sẽ gần bằng 7 pound.
Tuy nhiên, nếu bạn vẽ biểu đồ cho từng mức trung bình được tính trong mỗi 1.200 nhóm mẫu, hình dạng kết quả có thể dẫn đến phân phối đồng đều, nhưng rất khó để dự đoán chắc chắn hình dạng thực tế sẽ như thế nào. Càng nhiều mẫu mà nhà nghiên cứu sử dụng từ dân số hơn một triệu con số, đồ thị sẽ bắt đầu hình thành phân phối bình thường.
- Phân phối lấy mẫu là phân phối xác suất của thống kê thu được thông qua một số lượng lớn mẫu được lấy từ một dân số cụ thể. Phân phối lấy mẫu của một dân số nhất định là phân phối tần số của một loạt các kết quả khác nhau có thể xảy ra đối với thống kê dân số. Rất nhiều dữ liệu được rút ra và sử dụng bởi các học giả, nhà thống kê, nhà nghiên cứu, nhà tiếp thị và nhà phân tích thực sự là các mẫu chứ không phải dân số.
