Tương quan giả là gì
Trong thống kê, một mối tương quan giả, hoặc giả, đề cập đến một kết nối giữa hai biến xuất hiện nguyên nhân nhưng không phải là. Mối quan hệ giả mạo thường có sự xuất hiện của một biến ảnh hưởng đến một biến khác. Mối tương quan giả này thường được gây ra bởi một yếu tố thứ ba không rõ ràng tại thời điểm kiểm tra, đôi khi được gọi là yếu tố gây nhiễu.
Chìa khóa chính
- Tương quan giả, hay giả, là khi hai yếu tố xuất hiện tình cờ nhưng không phải. Sự xuất hiện của mối quan hệ nhân quả thường là do chuyển động tương tự trên biểu đồ hóa ra là trùng hợp ngẫu nhiên hoặc do yếu tố "gây nhiễu" thứ ba. thường có thể được gây ra bởi kích thước mẫu nhỏ hoặc điểm cuối tùy ý.
Làm thế nào tương quan giả
Khi hai biến ngẫu nhiên theo dõi sát nhau trên biểu đồ, rất dễ nghi ngờ mối tương quan hoặc mối quan hệ giữa hai yếu tố, trong đó một thay đổi ảnh hưởng đến yếu tố kia. Đặt "nhân quả" sang một bên, một chủ đề khác, quan sát này có thể khiến người đọc biểu đồ tin rằng chuyển động của biến A được liên kết với chuyển động trong biến B hoặc ngược lại. nhưng đôi khi, khi kiểm tra thống kê chặt chẽ hơn, các chuyển động liên kết là ngẫu nhiên hoặc gây ra bởi một yếu tố thứ ba ảnh hưởng đến hai yếu tố đầu tiên. Đây là một mối tương quan giả. Nghiên cứu được thực hiện với kích thước mẫu nhỏ hoặc điểm cuối tùy ý là đặc biệt dễ bị ảnh hưởng.
Ví dụ về tương quan giả
Nó không quá khó để khám phá những tương quan thú vị. Nhiều người sẽ trở nên giả mạo, mặc dù. Đối với các loài đực ở Phố Wall, hai mối tương quan giả phổ biến liên quan đến phụ nữ và thể thao. Bắt nguồn từ những năm 1920 là lý thuyết chiều dài váy, cho rằng độ dài của váy và hướng thị trường chứng khoán có mối tương quan với nhau. Nếu chiều dài váy dài, điều đó có nghĩa là thị trường chứng khoán đang đi xuống; nếu chúng ngắn, thị trường sẽ tăng lên. Vào khoảng cuối tháng 1, người ta nói về cái gọi là chỉ số Super Bowl, điều này cho thấy rằng một chiến thắng của đội AFC có thể có nghĩa là thị trường chứng khoán sẽ đi xuống trong năm tới, trong khi chiến thắng của đội NFC cho thấy sự gia tăng trong thị trường. Kể từ năm 1966, chỉ số này đã có tỷ lệ chính xác là 80%. Đó là một đoạn trò chuyện vui vẻ nhưng có lẽ không phải là thứ mà một cố vấn tài chính nghiêm túc muốn giới thiệu như một chiến lược đầu tư cho khách hàng.
Dưới đây là một số ví dụ khác về mối tương quan giả phổ biến:
- Đuối nước tăng khi doanh số bán kem tăng. Có vẻ như doanh số bán kem tăng lên gây ra đuối nước nhiều hơn, nhưng trên thực tế, nhiệt độ tăng cao có thể khiến nhiều người bơi lội hơn, cũng như mua nhiều kem hơn. Tỷ lệ giết người ở Mỹ từ năm 2006-2011 giảm xuống cùng mức với Microsoft Internet Explorer cách sử dụng. Các giám đốc điều hành nói vui lòng và cảm ơn bạn thường xuyên tận hưởng hiệu suất chia sẻ tốt hơn. Những người mặc trang phục của đội đua Raiders có nhiều khả năng phạm tội.
Làm thế nào để phát hiện mối tương quan giả
Các nhà thống kê và các nhà khoa học khác phân tích dữ liệu phải luôn đề phòng các mối quan hệ giả mạo mọi lúc. Có rất nhiều phương pháp mà họ sử dụng, bao gồm:
- Đảm bảo mẫu đại diện phù hợp. Lấy kích thước mẫu phù hợp. Cảnh giác với các điểm cuối tùy ý. Kiểm soát càng nhiều biến số bên ngoài càng tốt. Sử dụng giả thuyết null và kiểm tra giá trị p mạnh.
