Đa sắc thái là gì?
Multicollinearity là sự xuất hiện của sự giao thoa cao giữa các biến độc lập trong mô hình hồi quy bội. Đa sắc thái có thể dẫn đến kết quả sai lệch hoặc sai lệch khi nhà nghiên cứu hoặc nhà phân tích cố gắng xác định mức độ mỗi biến độc lập có thể được sử dụng hiệu quả nhất để dự đoán hoặc hiểu biến phụ thuộc trong mô hình thống kê. Nói chung, tính đa hình có thể dẫn đến khoảng tin cậy rộng hơn và giá trị xác suất kém tin cậy hơn cho các biến độc lập. Đó là, các suy luận thống kê từ một mô hình với tính đa hình có thể không đáng tin cậy.
Hiểu về bệnh đa nhân cách
Các nhà phân tích thống kê sử dụng nhiều mô hình hồi quy để dự đoán giá trị của một biến phụ thuộc được chỉ định dựa trên các giá trị của hai hoặc nhiều biến độc lập. Biến phụ thuộc đôi khi được gọi là biến kết quả, mục tiêu hoặc biến tiêu chí. Một ví dụ là mô hình hồi quy đa biến cố gắng dự đoán lợi nhuận cổ phiếu dựa trên các mục như tỷ lệ giá trên thu nhập, vốn hóa thị trường, hiệu suất trong quá khứ hoặc dữ liệu khác. Lợi nhuận chứng khoán là biến phụ thuộc và các bit khác nhau của dữ liệu tài chính là các biến độc lập.
Chìa khóa chính
- Multicollinearity là một khái niệm thống kê trong đó các biến độc lập trong một mô hình có mối tương quan với nhau. Đa số các biến độc lập sẽ dẫn đến các kết luận thống kê ít tin cậy hơn. Tốt hơn là sử dụng các biến độc lập không tương quan hoặc lặp lại khi xây dựng nhiều mô hình hồi quy sử dụng hai biến trở lên.
Đa cộng tuyến trong mô hình hồi quy bội cho thấy các biến độc lập cộng tuyến có liên quan trong một số thời trang, mặc dù mối quan hệ có thể hoặc không thể ngẫu nhiên. Ví dụ, hiệu suất trong quá khứ có thể liên quan đến vốn hóa thị trường, vì các cổ phiếu đã hoạt động tốt trong quá khứ sẽ có giá trị thị trường tăng. Nói cách khác, tính đa hình có thể tồn tại khi hai biến độc lập có mối tương quan cao. Nó cũng có thể xảy ra nếu một biến độc lập được tính từ các biến khác trong tập dữ liệu hoặc nếu hai biến độc lập cung cấp kết quả tương tự và lặp lại.
Một trong những cách phổ biến nhất để loại bỏ vấn đề đa cộng tuyến là trước tiên xác định các biến độc lập cộng tuyến và sau đó loại bỏ tất cả trừ một. Cũng có thể loại bỏ tính đa hình bằng cách kết hợp hai hoặc nhiều biến cộng tuyến thành một biến duy nhất. Phân tích thống kê sau đó có thể được tiến hành để nghiên cứu mối quan hệ giữa biến phụ thuộc được chỉ định và chỉ một biến độc lập duy nhất.
Ví dụ về đa cộng đồng
Đối với đầu tư, tính đa hướng là một cân nhắc phổ biến khi thực hiện phân tích kỹ thuật để dự đoán biến động giá có thể xảy ra trong tương lai của chứng khoán, chẳng hạn như chứng khoán hoặc tương lai hàng hóa. Các nhà phân tích thị trường muốn tránh sử dụng các chỉ số kỹ thuật được cộng tác ở chỗ chúng dựa trên các đầu vào rất giống nhau hoặc có liên quan; họ có xu hướng tiết lộ những dự đoán tương tự liên quan đến biến số phụ thuộc của biến động giá. Thay vào đó, phân tích thị trường phải dựa trên các biến độc lập khác nhau rõ rệt để đảm bảo rằng họ phân tích thị trường từ các quan điểm phân tích độc lập khác nhau.
Nhà phân tích kỹ thuật đáng chú ý John Bollinger, người tạo ra chỉ báo Dải bollinger, lưu ý rằng "một quy tắc chính yếu để sử dụng thành công phân tích kỹ thuật đòi hỏi phải tránh các chỉ số đa hướng giữa các chỉ số."
Để giải quyết vấn đề, các nhà phân tích tránh sử dụng hai hoặc nhiều chỉ số kỹ thuật cùng loại. Thay vào đó, họ phân tích bảo mật bằng một loại chỉ báo, chẳng hạn như chỉ báo động lượng và sau đó thực hiện phân tích riêng bằng cách sử dụng một loại chỉ báo khác, chẳng hạn như chỉ báo xu hướng.
Một ví dụ về vấn đề đa cộng đồng tiềm năng là thực hiện phân tích kỹ thuật chỉ sử dụng một số chỉ số tương tự, chẳng hạn như stochastic, chỉ số sức mạnh tương đối (RSI) và Williams% R, tất cả đều là các chỉ báo động lượng dựa vào đầu vào tương tự và có khả năng tạo ra tương tự các kết quả. Trong trường hợp này, tốt hơn là loại bỏ tất cả trừ một trong các chỉ báo hoặc tìm cách hợp nhất một vài trong số chúng thành một chỉ báo, đồng thời thêm một chỉ báo xu hướng không có khả năng tương quan cao với chỉ báo động lượng.
