Hồi quy tuyến tính là gì?
Hồi quy tuyến tính là một biểu đồ dữ liệu biểu đồ mối quan hệ tuyến tính giữa một biến độc lập và biến phụ thuộc. Nó thường được sử dụng để hiển thị trực quan sức mạnh của mối quan hệ và sự phân tán kết quả - tất cả nhằm mục đích giải thích hành vi của biến phụ thuộc.
Nói rằng chúng tôi muốn kiểm tra sức mạnh của mối quan hệ giữa lượng kem ăn và béo phì. Chúng tôi sẽ lấy biến độc lập, lượng kem và liên hệ nó với biến phụ thuộc, béo phì, để xem liệu có mối quan hệ nào không. Cho một hồi quy là một hiển thị đồ họa của mối quan hệ này, độ biến thiên của dữ liệu càng thấp, mối quan hệ càng mạnh mẽ và sự phù hợp với đường hồi quy càng chặt chẽ.
Chìa khóa chính
- Mô hình hồi quy tuyến tính mô hình mối quan hệ giữa một biến phụ thuộc và biến độc lập. Phân tích hồi quy có thể đạt được nếu các biến độc lập, không có sự không đồng nhất và các thuật ngữ lỗi của các biến không tương quan. Hồi quy tuyến tính trong Excel dễ dàng hơn với Công cụ phân tích dữ liệu.
Những cân nhắc quan trọng
Có một vài giả định quan trọng về tập dữ liệu của bạn phải đúng để tiến hành phân tích hồi quy:
- Các biến phải thực sự độc lập (sử dụng kiểm tra Chi bình phương). Dữ liệu không được có các phương sai lỗi khác nhau (điều này được gọi là heteroskedasticity (cũng được đánh vần là không đồng nhất)). Nếu không, nó có nghĩa là các biến có tương quan huyết thanh.
Nếu ba điều đó nghe có vẻ phức tạp, chúng là. Nhưng hiệu quả của một trong những cân nhắc không đúng là một ước tính sai lệch. Về cơ bản, bạn sẽ đánh lạc hướng mối quan hệ bạn đang đo lường.
Xuất ra một hồi quy trong Excel
Bước đầu tiên trong việc chạy phân tích hồi quy trong Excel là kiểm tra kỹ xem plugin Excel miễn phí DataP ToolPak đã được cài đặt chưa. Plugin này làm cho việc tính toán một loạt các số liệu thống kê rất dễ dàng. Không bắt buộc phải lập biểu đồ đường hồi quy tuyến tính, nhưng nó giúp việc tạo bảng thống kê đơn giản hơn. Để xác minh nếu được cài đặt, chọn "Dữ liệu" từ thanh công cụ. Nếu "Phân tích dữ liệu" là một tùy chọn, tính năng này được cài đặt và sẵn sàng để sử dụng. Nếu chưa được cài đặt, bạn có thể yêu cầu tùy chọn này bằng cách nhấp vào nút Office và chọn "Tùy chọn Excel".
Sử dụng ToolPak phân tích dữ liệu, tạo đầu ra hồi quy chỉ bằng vài cú nhấp chuột.
Biến độc lập đi trong phạm vi X.
Đưa ra lợi nhuận S & P 500, nói rằng chúng tôi muốn biết liệu chúng tôi có thể ước tính sức mạnh và mối quan hệ của lợi nhuận cổ phiếu Visa (V) hay không. Cổ phiếu Visa (V) trả về dữ liệu điền vào cột 1 dưới dạng biến phụ thuộc. S & P 500 trả về dữ liệu cư trú cột 2 dưới dạng biến độc lập.
- Chọn "Dữ liệu" từ thanh công cụ. Menu "Dữ liệu" hiển thị. Chọn "Phân tích dữ liệu". Hộp thoại Phân tích dữ liệu - Công cụ phân tích hiển thị. Từ menu, chọn "Regression" và nhấp vào "OK". Trong hộp thoại Regression, nhấp vào hộp "Input Y Range" và chọn dữ liệu biến phụ thuộc (Visa (V) trả về). Nhấp vào hộp "Nhập X Phạm vi" và chọn dữ liệu biến độc lập (trả về S & P 500). Nhấp vào "OK" để chạy kết quả.
Giải thích kết quả
Sử dụng dữ liệu đó (giống với bài viết bình phương R của chúng tôi), chúng tôi nhận được bảng sau:
Giá trị R 2, còn được gọi là hệ số xác định, đo lường tỷ lệ biến thiên của biến phụ thuộc được giải thích bởi biến độc lập hoặc mô hình hồi quy phù hợp với dữ liệu như thế nào. Giá trị R 2 nằm trong khoảng từ 0 đến 1 và giá trị cao hơn cho thấy mức độ phù hợp tốt hơn. Giá trị p, hoặc giá trị xác suất, cũng nằm trong khoảng từ 0 đến 1 và cho biết thử nghiệm có ý nghĩa hay không. Ngược lại với giá trị R 2, giá trị p nhỏ hơn là thuận lợi vì nó chỉ ra mối tương quan giữa các biến phụ thuộc và biến độc lập.
Biểu đồ hồi quy trong Excel
Chúng ta có thể lập biểu đồ hồi quy trong Excel bằng cách tô sáng dữ liệu và lập biểu đồ dưới dạng biểu đồ phân tán. Để thêm một dòng hồi quy, chọn "Bố cục" từ menu "Công cụ biểu đồ". Trong hộp thoại, chọn "Đường xu hướng" và sau đó "Đường xu hướng tuyến tính". Để thêm giá trị R 2, chọn "Tùy chọn xu hướng khác" từ menu "Đường xu hướng. Cuối cùng, chọn" Hiển thị giá trị bình phương R trên biểu đồ ". Kết quả trực quan tổng hợp sức mạnh của mối quan hệ, mặc dù không phải trả nhiều chi tiết như bảng trên.
