Lỗi lấy mẫu là gì?
Lỗi lấy mẫu là lỗi thống kê xảy ra khi nhà phân tích không chọn mẫu đại diện cho toàn bộ dữ liệu và kết quả tìm thấy trong mẫu không đại diện cho kết quả sẽ thu được từ toàn bộ dân số. Lấy mẫu là một phân tích được thực hiện bằng cách chọn một số quan sát từ dân số lớn hơn và lựa chọn có thể tạo ra cả lỗi lấy mẫu và lỗi không lấy mẫu.
Chìa khóa chính
- Lỗi lấy mẫu là lỗi thống kê xảy ra khi nhà phân tích không chọn mẫu đại diện cho toàn bộ dữ liệu. Kết quả tìm thấy trong mẫu do đó không thể hiện kết quả thu được từ toàn bộ dân số. Lỗi lấy mẫu có thể giảm bằng cách chọn ngẫu nhiên mẫu và / hoặc tăng số lượng quan sát.
Hiểu lỗi lấy mẫu
Lỗi lấy mẫu là sai lệch về giá trị được lấy mẫu so với giá trị dân số thực do thực tế mẫu không đại diện cho dân số hoặc bị sai lệch theo một cách nào đó. Ngay cả các mẫu ngẫu nhiên cũng sẽ có một số lỗi lấy mẫu vì nó chỉ là xấp xỉ dân số mà từ đó nó được rút ra.
Lỗi lấy mẫu có thể được loại bỏ khi tăng kích thước mẫu và cũng bằng cách đảm bảo rằng mẫu đại diện đầy đủ cho toàn bộ dân số. Giả sử, ví dụ, Công ty XYZ cung cấp dịch vụ dựa trên đăng ký cho phép người tiêu dùng trả phí hàng tháng để truyền phát video và lập trình khác qua web.
Công ty muốn khảo sát các chủ nhà xem ít nhất 10 giờ lập trình trên web mỗi tuần và trả tiền cho một dịch vụ truyền phát video hiện có. XYZ muốn xác định tỷ lệ phần trăm dân số quan tâm đến dịch vụ thuê bao giá thấp hơn. Nếu XYZ không suy nghĩ kỹ về quy trình lấy mẫu, một số loại lỗi lấy mẫu có thể xảy ra.
Ví dụ về lỗi lấy mẫu
Lỗi đặc tả dân số có nghĩa là XYZ không hiểu các loại người tiêu dùng cụ thể cần được đưa vào mẫu. Ví dụ, nếu XYZ tạo ra một nhóm người trong độ tuổi từ 15 đến 25 tuổi, nhiều người trong số những người tiêu dùng đó không đưa ra quyết định mua về dịch vụ truyền phát video vì họ không làm việc toàn thời gian. Mặt khác, nếu XYZ tập hợp một mẫu người lớn đang làm việc đưa ra quyết định mua hàng, người tiêu dùng trong nhóm này có thể không xem 10 giờ lập trình video mỗi tuần.
Lỗi lựa chọn cũng gây ra sự biến dạng trong kết quả của một mẫu và một ví dụ phổ biến là một cuộc khảo sát chỉ dựa vào một phần nhỏ những người trả lời ngay lập tức. Nếu XYZ nỗ lực theo dõi những người tiêu dùng không phản hồi ban đầu, kết quả khảo sát có thể thay đổi. Hơn nữa, nếu XYZ loại trừ người tiêu dùng không phản hồi ngay lập tức, kết quả mẫu có thể không phản ánh sở thích của toàn bộ dân số.
Bao thanh toán trong các lỗi không lấy mẫu
XYZ cũng muốn tránh các lỗi không lấy mẫu do lỗi của con người gây ra, chẳng hạn như lỗi xảy ra trong quá trình khảo sát. Nếu một nhóm người tiêu dùng chỉ xem năm giờ lập trình video một tuần và được đưa vào khảo sát, quyết định đó là lỗi không lấy mẫu. Đặt câu hỏi sai lệch là một loại lỗi khác.
