Lỗi không lấy mẫu là gì?
Lỗi không lấy mẫu là thuật ngữ thống kê chỉ lỗi xảy ra trong quá trình thu thập dữ liệu, khiến dữ liệu khác với giá trị thực. Lỗi không lấy mẫu khác với lỗi lấy mẫu. Một lỗi lấy mẫu được giới hạn ở bất kỳ sự khác biệt nào giữa các giá trị mẫu và giá trị vũ trụ phát sinh do kích thước mẫu bị giới hạn. (Toàn bộ vũ trụ không thể được lấy mẫu trong một cuộc khảo sát hoặc điều tra dân số.)
Chìa khóa chính
- Lỗi không lấy mẫu là thuật ngữ được sử dụng trong thống kê đề cập đến lỗi xảy ra trong quá trình thu thập dữ liệu, khiến dữ liệu khác với giá trị thực. Một lỗi không lấy mẫu đề cập đến các lỗi ngẫu nhiên hoặc hệ thống và các lỗi này có thể gây khó khăn khi phát hiện trong một cuộc khảo sát, mẫu hoặc điều tra dân số. Lỗi không lấy mẫu hệ thống tồi tệ hơn lỗi không lấy mẫu ngẫu nhiên vì lỗi hệ thống có thể dẫn đến nghiên cứu, khảo sát hoặc điều tra dân số phải được loại bỏ. Số lỗi càng cao, thông tin càng kém tin cậy. Khi xảy ra lỗi không lấy mẫu, tỷ lệ sai lệch trong nghiên cứu hoặc khảo sát sẽ tăng lên.
Một lỗi lấy mẫu có thể dẫn đến ngay cả khi không có lỗi nào được thực hiện. "Lỗi" xuất phát từ thực tế là dữ liệu trong một mẫu không thể khớp hoàn hảo với dữ liệu trong vũ trụ mà từ đó mẫu được lấy. "Lỗi" này có thể được giảm thiểu bằng cách tăng cỡ mẫu.
Lỗi không lấy mẫu bao gồm tất cả các sai lệch khác, bao gồm cả những lỗi phát sinh từ kỹ thuật lấy mẫu kém.
Cách hoạt động của một lỗi không lấy mẫu
Lỗi không lấy mẫu có thể xuất hiện trong cả mẫu và cuộc tổng điều tra trong đó toàn bộ dân số được khảo sát. Lỗi không lấy mẫu thuộc hai loại: ngẫu nhiên và có hệ thống.
Các lỗi ngẫu nhiên được cho là bù trừ cho nhau và do đó, thường xuyên nhất, ít được quan tâm. Các lỗi hệ thống, mặt khác, ảnh hưởng đến toàn bộ mẫu và do đó đưa ra một vấn đề quan trọng hơn. Các lỗi ngẫu nhiên, nói chung, sẽ không dẫn đến việc loại bỏ một mẫu hoặc điều tra dân số, trong khi đó một lỗi hệ thống rất có thể sẽ khiến dữ liệu được thu thập không sử dụng được.
Lỗi không lấy mẫu được gây ra bởi các yếu tố bên ngoài chứ không phải là một vấn đề trong một cuộc khảo sát, nghiên cứu hoặc điều tra dân số.
Có nhiều cách lỗi không lấy mẫu có thể xảy ra. Ví dụ: lỗi không lấy mẫu có thể bao gồm nhưng không giới hạn ở lỗi nhập dữ liệu, câu hỏi khảo sát sai lệch, xử lý / ra quyết định sai lệch, không phản hồi, kết luận phân tích không phù hợp và thông tin sai do người trả lời cung cấp.
Cân nhắc đặc biệt
Mặc dù việc tăng kích thước mẫu có thể giúp giảm thiểu các lỗi lấy mẫu, nhưng nó sẽ không có tác dụng gì trong việc giảm các lỗi không lấy mẫu. Điều này là do các lỗi không lấy mẫu thường rất khó phát hiện và hầu như không thể loại bỏ chúng.
Lỗi không lấy mẫu bao gồm lỗi không phản hồi, lỗi phạm vi bảo hiểm, lỗi phỏng vấn và lỗi xử lý. Ví dụ, một lỗi bảo hiểm sẽ xảy ra nếu một người được tính hai lần trong một cuộc khảo sát hoặc câu trả lời của họ bị trùng lặp trong cuộc khảo sát. Nếu một người phỏng vấn bị sai lệch trong lấy mẫu của họ, lỗi không lấy mẫu sẽ được coi là lỗi của người phỏng vấn.
Ngoài ra, rất khó để chứng minh rằng những người trả lời trong một cuộc khảo sát đang cung cấp thông tin sai lệch do nhầm lẫn hoặc cố ý. Dù bằng cách nào, thông tin sai lệch được cung cấp bởi người trả lời được coi là lỗi không lấy mẫu và chúng được mô tả là lỗi phản hồi.
Lỗi kỹ thuật tồn tại trong một thể loại khác nhau. Nếu có bất kỳ mục nào liên quan đến dữ liệu Tập tin như mã hóa, thu thập, nhập hoặc chỉnh sửa thì chúng được coi là lỗi xử lý.
