Hồi quy tuyến tính bội - MLR là gì?
Hồi quy tuyến tính bội (MLR), còn được gọi đơn giản là hồi quy bội, là một kỹ thuật thống kê sử dụng một số biến giải thích để dự đoán kết quả của biến trả lời. Mục tiêu của nhiều hồi quy tuyến tính (MLR) là mô hình hóa mối quan hệ tuyến tính giữa các biến giải thích (độc lập) và biến phản ứng (phụ thuộc).
Về bản chất, hồi quy bội là phần mở rộng của hồi quy bình phương nhỏ nhất (OLS) có liên quan đến nhiều hơn một biến giải thích.
Công thức cho hồi quy tuyến tính là
Hay nói, là một tài tài của, qua, qua, qua một tài khác, qua giữ, qua một tài khác Yi = 0 + 1 xi1 + 2 xi2 +… + p xip + ϵwhere, đối với các quan sát i = n: yi = biến phụ thuộcxi = biến mở rộngβ0 = y-chặn (hằng số thuật ngữ) βp = hệ số độ dốc cho mỗi biến giải thíchϵ = thuật ngữ lỗi của mô hình (còn được gọi là phần dư)
Giải thích nhiều hồi quy tuyến tính
Hồi quy tuyến tính đơn giản là một hàm cho phép nhà phân tích hoặc nhà thống kê đưa ra dự đoán về một biến dựa trên thông tin được biết về một biến khác. Hồi quy tuyến tính chỉ có thể được sử dụng khi một biến có hai biến liên tục Một biến độc lập và biến phụ thuộc. Biến độc lập là tham số được sử dụng để tính toán biến phụ thuộc hoặc kết quả. Một mô hình hồi quy bội mở rộng đến một số biến giải thích.
Mô hình hồi quy bội dựa trên các giả định sau:
- Có một mối quan hệ tuyến tính giữa các biến phụ thuộc và các biến độc lập. Các biến độc lập không tương quan quá cao với nhau. Các quan sát của tôi được chọn độc lập và ngẫu nhiên từ dân số. Thông thường nên được phân phối với giá trị trung bình là 0 và phương sai σ.
Hệ số xác định (bình phương R) là một số liệu thống kê được sử dụng để đo lường mức độ biến đổi trong kết quả có thể được giải thích bằng sự thay đổi trong các biến độc lập. R 2 luôn tăng khi có nhiều yếu tố dự đoán được thêm vào mô hình MLR mặc dù các yếu tố dự đoán có thể không liên quan đến biến kết quả.
Do đó, bản thân R 2 không thể được sử dụng để xác định dự đoán nào sẽ được đưa vào mô hình và loại nào nên được loại trừ. R 2 chỉ có thể nằm trong khoảng từ 0 đến 1, trong đó 0 chỉ ra rằng kết quả không thể dự đoán được bởi bất kỳ biến độc lập nào và 1 chỉ ra rằng kết quả có thể được dự đoán mà không có lỗi từ các biến độc lập.
Khi diễn giải kết quả của hồi quy bội, hệ số beta là hợp lệ trong khi giữ tất cả các biến khác không đổi ("tất cả các giá trị khác bằng nhau"). Đầu ra từ hồi quy bội có thể được hiển thị theo chiều ngang dưới dạng phương trình hoặc theo chiều dọc ở dạng bảng.
Ví dụ sử dụng hồi quy tuyến tính bội
Ví dụ, một nhà phân tích có thể muốn biết sự chuyển động của thị trường ảnh hưởng đến giá của Exxon Mobil (XOM). Trong trường hợp này, phương trình tuyến tính của anh ta sẽ có giá trị của chỉ số S & P 500 là biến độc lập hoặc dự đoán và giá của XOM là biến phụ thuộc.
Trong thực tế, có nhiều yếu tố dự đoán kết quả của một sự kiện. Chuyển động giá của Exxon Mobil, ví dụ, phụ thuộc vào nhiều thứ hơn là hiệu suất của toàn thị trường. Các dự báo khác như giá dầu, lãi suất và biến động giá của hợp đồng tương lai dầu có thể ảnh hưởng đến giá XOM và giá cổ phiếu của các công ty dầu khác. Để hiểu một mối quan hệ trong đó có nhiều hơn hai biến, một hồi quy tuyến tính đa được sử dụng.
Hồi quy tuyến tính đa biến (MLR) được sử dụng để xác định mối quan hệ toán học giữa một số biến ngẫu nhiên. Nói cách khác, MLR kiểm tra xem có bao nhiêu biến độc lập có liên quan đến một biến phụ thuộc. Khi từng yếu tố độc lập đã được xác định để dự đoán biến phụ thuộc, thông tin về nhiều biến có thể được sử dụng để tạo dự đoán chính xác về mức độ ảnh hưởng của chúng đối với biến kết quả. Mô hình tạo ra một mối quan hệ dưới dạng một đường thẳng (tuyến tính) gần đúng nhất với tất cả các điểm dữ liệu riêng lẻ.
Đề cập đến phương trình MLR ở trên, trong ví dụ của chúng tôi:
- y i = biến phụ thuộc: giá của XOMx i1 = lãi suấtx i2 = giá dầux i3 = giá trị của S & P 500 indexx i4 = giá dầu tương laiB 0 = y-chặn tại thời điểm zeroB 1 = hệ số hồi quy đo lường sự thay đổi đơn vị phụ thuộc biến khi x i1 thay đổi - thay đổi giá XOM khi lãi suất thay đổiB 2 = giá trị hệ số đo lường sự thay đổi đơn vị của biến phụ thuộc khi x i2 thay đổi - thay đổi giá XOM khi giá dầu thay đổi
Các ước lượng bình phương nhỏ nhất, B 0, B 1, B 2 B B, thường được tính bằng phần mềm thống kê. Vì nhiều biến có thể được đưa vào mô hình hồi quy, trong đó mỗi biến độc lập được phân biệt với một số số 1, 2, 3, 4… p. Mô hình hồi quy bội cho phép nhà phân tích dự đoán kết quả dựa trên thông tin được cung cấp trên nhiều biến giải thích.
Tuy nhiên, mô hình không phải lúc nào cũng hoàn toàn chính xác vì mỗi điểm dữ liệu có thể hơi khác so với kết quả mà mô hình dự đoán. Giá trị còn lại, E, là sự khác biệt giữa kết quả thực tế và kết quả dự đoán, được đưa vào mô hình để tính đến các biến đổi nhỏ như vậy.
Giả sử chúng tôi chạy mô hình hồi quy giá XOM của mình thông qua phần mềm tính toán thống kê, sẽ trả về đầu ra này:
Một nhà phân tích sẽ giải thích sản lượng này có nghĩa là nếu các biến khác được giữ cố định, giá của XOM sẽ tăng 7, 8% nếu giá dầu trên thị trường tăng 1%. Mô hình cũng cho thấy giá của XOM sẽ giảm 1, 5% sau khi lãi suất tăng 1%. R 2 chỉ ra rằng 86, 5% các biến thể trong giá cổ phiếu của Exxon Mobil có thể được giải thích bằng những thay đổi về lãi suất, giá dầu, tương lai dầu và chỉ số S & P 500.
Chìa khóa chính
- Hồi quy tuyến tính đa biến (MLR), còn được gọi đơn giản là hồi quy bội, là một kỹ thuật thống kê sử dụng một số biến giải thích để dự đoán kết quả của biến phản ứng. Hồi quy đa biến là một phần mở rộng của hồi quy tuyến tính (OLS) chỉ sử dụng một biến giải thích. MLR được sử dụng rộng rãi trong kinh tế lượng và suy luận tài chính.
Sự khác biệt giữa hồi quy tuyến tính và đa biến
Hồi quy tuyến tính (OLS) so sánh phản ứng của một biến phụ thuộc với sự thay đổi trong một số biến giải thích. Tuy nhiên, rất hiếm khi một biến phụ thuộc được giải thích chỉ bằng một biến. Trong trường hợp này, một nhà phân tích sử dụng nhiều hồi quy, cố gắng giải thích một biến phụ thuộc bằng cách sử dụng nhiều hơn một biến độc lập. Nhiều hồi quy có thể là tuyến tính và phi tuyến.
Nhiều hồi quy dựa trên giả định rằng có một mối quan hệ tuyến tính giữa cả hai biến phụ thuộc và biến độc lập. Nó cũng giả định không có mối tương quan lớn giữa các biến độc lập.
