Hồi quy từng bước là gì?
Phân tích hồi quy là một phương pháp thống kê được sử dụng rộng rãi nhằm tìm cách xác định mối quan hệ giữa các biến. Ý tưởng là tập hợp dữ liệu liên quan để đưa ra quyết định sáng suốt hơn và là một thông lệ phổ biến trong thế giới đầu tư. Hồi quy từng bước là việc xây dựng lặp lại từng bước của mô hình hồi quy bao gồm lựa chọn tự động các biến độc lập. Tính khả dụng của các gói phần mềm thống kê giúp có thể hồi quy từng bước, ngay cả trong các mô hình có hàng trăm biến.
Các loại hồi quy từng bước
Mục tiêu cơ bản của hồi quy từng bước là, thông qua một loạt các thử nghiệm (F-tests, t-tests) để tìm ra một tập hợp các biến độc lập có ảnh hưởng đáng kể đến biến phụ thuộc. Điều này được thực hiện với các máy tính thông qua việc lặp lại, đây là quá trình đi đến kết quả hoặc quyết định bằng cách trải qua các vòng hoặc chu kỳ phân tích lặp đi lặp lại. Tiến hành kiểm tra tự động với sự trợ giúp từ các gói phần mềm thống kê có lợi thế là tiết kiệm thời gian cho cá nhân.
Chìa khóa chính
- Phân tích hồi quy là một phương pháp thống kê nhằm tìm hiểu và đo lường mối quan hệ giữa các biến độc lập và phụ thuộc. Hồi quy theo phương pháp là phương pháp kiểm tra ý nghĩa thống kê của từng biến độc lập trong mô hình. Phương pháp lựa chọn chuyển tiếp thêm một biến và sau đó kiểm tra mức ý nghĩa thống kê Phương pháp loại bỏ lạc hậu bắt đầu với một mô hình được tải với nhiều biến và sau đó loại bỏ một biến để kiểm tra mức độ quan trọng của nó so với kết quả tổng thể. Hồi quy theo chiều ngang có nhiều chỉ trích, vì đó là cách tiếp cận phù hợp với dữ liệu vào mô hình để đạt được kết quả mong muốn.
Hồi quy từng bước có thể đạt được bằng cách thử một biến độc lập tại một thời điểm và đưa nó vào mô hình hồi quy nếu nó có ý nghĩa thống kê hoặc bằng cách bao gồm tất cả các biến độc lập tiềm năng trong mô hình và loại bỏ những biến không có ý nghĩa thống kê. Một số sử dụng kết hợp cả hai phương pháp và do đó có ba cách tiếp cận để hồi quy từng bước:
- Lựa chọn chuyển tiếp bắt đầu không có biến trong mô hình, kiểm tra từng biến khi nó được thêm vào mô hình, sau đó giữ những biến được coi là có ý nghĩa thống kê nhất lặp lại quá trình cho đến khi kết quả là tối ưu. Việc loại bỏ hoàn toàn bắt đầu bằng một tập hợp các biến độc lập, xóa từng cái một, sau đó kiểm tra xem liệu biến bị loại bỏ có ý nghĩa thống kê hay không. Loại bỏ hướng là sự kết hợp của hai phương pháp đầu tiên kiểm tra biến nào nên được bao gồm hoặc loại trừ.
Một ví dụ về hồi quy từng bước sử dụng phương pháp loại bỏ lạc hậu sẽ là nỗ lực tìm hiểu việc sử dụng năng lượng tại nhà máy bằng cách sử dụng các biến như thời gian chạy thiết bị, tuổi thiết bị, kích thước nhân viên, nhiệt độ bên ngoài và thời gian trong năm. Mô hình này bao gồm tất cả các biến số, sau đó từng biến được loại bỏ, từng biến một để xác định giá trị nào ít có ý nghĩa thống kê nhất. Cuối cùng, mô hình có thể cho thấy thời gian trong năm và nhiệt độ là đáng kể nhất, có thể gợi ý mức tiêu thụ năng lượng cao nhất tại nhà máy là khi mức sử dụng điều hòa không khí ở mức cao nhất.
Hạn chế của hồi quy từng bước
Phân tích hồi quy, cả tuyến tính và đa biến, được sử dụng rộng rãi trong thế giới đầu tư ngày nay. Ý tưởng thường là tìm ra các mô hình tồn tại trong quá khứ cũng có thể tái diễn trong tương lai. Chẳng hạn, hồi quy tuyến tính đơn giản có thể xem xét tỷ lệ giá trên thu nhập và lợi nhuận cổ phiếu trong nhiều năm để xác định xem các cổ phiếu có tỷ lệ P / E thấp (biến độc lập) có mang lại lợi nhuận cao hơn (biến phụ thuộc) hay không. Vấn đề với cách tiếp cận này là điều kiện thị trường thường thay đổi và các mối quan hệ được giữ trong quá khứ không nhất thiết phải đúng trong hiện tại hoặc tương lai.
Trong khi đó, quá trình hồi quy từng bước có nhiều chỉ trích và thậm chí có những lời kêu gọi ngừng sử dụng phương pháp này hoàn toàn. Các nhà thống kê lưu ý một số nhược điểm của cách tiếp cận, bao gồm kết quả không chính xác, sai lệch vốn có trong chính quy trình và sự cần thiết phải có sức mạnh tính toán đáng kể để phát triển các mô hình hồi quy phức tạp thông qua phép lặp.
