Xu hướng chọn mẫu là gì?
Sai lệch lựa chọn mẫu là một loại sai lệch gây ra bằng cách chọn dữ liệu không ngẫu nhiên để phân tích thống kê. Sự thiên vị tồn tại do một lỗ hổng trong quy trình chọn mẫu, trong đó một tập hợp con của dữ liệu bị loại trừ một cách có hệ thống do một thuộc tính cụ thể. Việc loại trừ tập hợp con có thể ảnh hưởng đến ý nghĩa thống kê của thử nghiệm hoặc tạo ra kết quả bị bóp méo.
Hiểu xu hướng chọn mẫu
Xu hướng sống sót là một loại phổ biến của sự lựa chọn mẫu. Ví dụ, khi kiểm tra lại một chiến lược đầu tư vào một nhóm cổ phiếu lớn, có thể thuận tiện để tìm kiếm các chứng khoán có dữ liệu cho toàn bộ giai đoạn mẫu. Nếu chúng ta sẽ thử nghiệm chiến lược chống lại dữ liệu chứng khoán trong 15 năm, chúng ta có thể có xu hướng tìm kiếm các cổ phiếu có thông tin đầy đủ cho toàn bộ thời gian 15 năm. Tuy nhiên, việc loại bỏ một cổ phiếu ngừng giao dịch hoặc sớm rời khỏi thị trường sẽ tạo ra sự sai lệch trong mẫu dữ liệu của chúng tôi. Vì chúng tôi chỉ bao gồm các cổ phiếu tồn tại trong giai đoạn 15 năm, kết quả cuối cùng của chúng tôi sẽ bị sai sót, vì chúng hoạt động đủ tốt để tồn tại trên thị trường.
Các chỉ số hiệu suất quỹ phòng hộ là một ví dụ về xu hướng lựa chọn mẫu đối với xu hướng sống sót. Bởi vì các quỹ phòng hộ không tồn tại đã ngừng báo cáo hiệu suất của họ cho các nhà tổng hợp chỉ số, các chỉ số dẫn đến tự nhiên nghiêng về các quỹ và chiến lược vẫn tồn tại, do đó, tồn tại.
Các nhà phân tích có thể điều chỉnh để tính đến những sai lệch này nhưng có thể đưa ra những sai lệch tin tức trong quá trình này.
