Tổng bình phương là gì?
Tổng bình phương là một kỹ thuật thống kê được sử dụng trong phân tích hồi quy để xác định độ phân tán của các điểm dữ liệu. Trong phân tích hồi quy, mục tiêu là xác định mức độ phù hợp của chuỗi dữ liệu với chức năng có thể giúp giải thích cách tạo chuỗi dữ liệu. Tổng bình phương được sử dụng như một cách toán học để tìm hàm phù hợp nhất (thay đổi ít nhất) từ dữ liệu.
Công thức tính tổng bình phương là
Hay nói, là một tài tài của, qua, qua, qua một tài khác, qua giữ, qua một tài khác Đối với tập X gồm n mục: Tổng bình phương = i = 0∑n (Xi X) 2where: Xi = Mục thứ i trong tập X = Giá trị trung bình của tất cả các mục trong tập (Xi X) = Độ lệch của từng mục so với giá trị trung bình
Tổng bình phương còn được gọi là biến thể.
Sum of Squares cho bạn biết điều gì?
Tổng bình phương là thước đo độ lệch so với giá trị trung bình. Trong thống kê, giá trị trung bình là trung bình của một tập hợp số và là thước đo được sử dụng phổ biến nhất của xu hướng trung tâm. Giá trị trung bình số học được tính đơn giản bằng cách tính tổng các giá trị trong tập dữ liệu và chia cho số lượng giá trị.
Giả sử giá đóng cửa của Microsoft (MSFT) trong năm ngày qua là 74, 01, 74, 77, 73, 94, 73, 61 và 73, 40 bằng đô la Mỹ. Tổng của tổng giá là $ 369, 73 và giá trung bình hoặc trung bình của sách giáo khoa do đó sẽ là $ 369, 73 / 5 = $ 73, 95.
Nhưng biết giá trị trung bình của một bộ đo không phải lúc nào cũng đủ. Đôi khi, thật hữu ích khi biết có bao nhiêu biến thể trong một tập hợp các phép đo. Các giá trị riêng lẻ cách nhau bao xa có thể cung cấp một số thông tin chi tiết về mức độ phù hợp của các quan sát hoặc giá trị đối với mô hình hồi quy được tạo.
Ví dụ: nếu một nhà phân tích muốn biết liệu giá cổ phiếu của MSFT có khớp với giá của Apple (AAPL) hay không, anh ta có thể liệt kê ra các quan sát cho quá trình của cả hai cổ phiếu trong một khoảng thời gian nhất định, giả sử 1, 2 hoặc 10 năm và tạo ra một mô hình tuyến tính với mỗi quan sát hoặc các phép đo được ghi lại. Nếu mối quan hệ giữa cả hai biến (nghĩa là giá của AAPL và giá của MSFT) không phải là một đường thẳng, thì có những biến thể trong tập dữ liệu cần được xem xét kỹ lưỡng.
Trong thống kê, nếu dòng trong mô hình tuyến tính được tạo ra không vượt qua tất cả các phép đo giá trị, thì một số biến thiên đã được quan sát thấy trong giá cổ phiếu là không giải thích được. Tổng bình phương được sử dụng để tính toán liệu mối quan hệ tuyến tính có tồn tại giữa hai biến hay không và bất kỳ biến thiên không giải thích được gọi là tổng bình phương còn lại.
Tổng bình phương là tổng bình phương của biến thể, trong đó biến thể được định nghĩa là mức chênh lệch giữa mỗi giá trị riêng lẻ và giá trị trung bình. Để xác định tổng bình phương, khoảng cách giữa mỗi điểm dữ liệu và đường phù hợp nhất được bình phương và sau đó được tính tổng. Dòng phù hợp nhất sẽ giảm thiểu giá trị này.
Cách tính tổng bình phương
Bây giờ bạn có thể thấy lý do tại sao phép đo được gọi là tổng độ lệch bình phương hoặc viết tắt là tổng bình phương. Sử dụng ví dụ MSFT của chúng tôi ở trên, tổng bình phương có thể được tính như sau:
- SS = (74, 01 - 73, 95) 2 + (74, 77 - 73, 95) 2 + (73, 94 - 73, 95) 2 + (73, 61 - 73, 95) 2 + (73, 40 - 73, 95) 2 SS = (0, 06) 2 + (0, 82) 2 + (- 0, 01) 2 + (-0, 34) 2 + (-0, 55) 2 SS = 1, 0942
Cộng tổng các độ lệch một mình mà không bình phương sẽ dẫn đến một số bằng hoặc gần bằng 0 vì độ lệch âm sẽ bù đắp gần như hoàn hảo các độ lệch dương. Để có được một con số thực tế hơn, tổng độ lệch phải được bình phương. Tổng bình phương sẽ luôn là một số dương vì bình phương của bất kỳ số nào, dù dương hay âm, luôn luôn dương.
Ví dụ về Cách sử dụng Tổng bình phương
Dựa trên kết quả tính toán MSFT, tổng bình phương cao cho thấy hầu hết các giá trị nằm cách xa giá trị trung bình và do đó, có sự biến động lớn trong dữ liệu. Tổng bình phương thấp đề cập đến độ biến thiên thấp trong tập hợp các quan sát.
Trong ví dụ trên, 1.0942 cho thấy sự biến động của giá cổ phiếu của MSFT trong năm ngày qua là rất thấp và các nhà đầu tư muốn đầu tư vào các cổ phiếu có đặc điểm là ổn định giá và biến động thấp có thể lựa chọn MSFT.
Chìa khóa chính
- Tổng bình phương đo độ lệch của các điểm dữ liệu so với giá trị trung bình. Kết quả tổng bình phương cao hơn cho thấy mức độ biến động lớn trong tập dữ liệu, trong khi kết quả thấp hơn cho thấy dữ liệu thay đổi đáng kể so với giá trị trung bình.
Hạn chế của việc sử dụng Sum of Squares
Đưa ra quyết định đầu tư vào việc mua cổ phiếu nào đòi hỏi nhiều quan sát hơn so với những gì được liệt kê ở đây. Một nhà phân tích có thể phải làm việc với nhiều năm dữ liệu để biết chắc chắn mức độ biến động của một tài sản cao hay thấp. Khi nhiều điểm dữ liệu được thêm vào tập hợp, tổng bình phương sẽ trở nên lớn hơn vì các giá trị sẽ được trải rộng hơn.
Các phép đo biến đổi được sử dụng rộng rãi nhất là độ lệch chuẩn và phương sai. Tuy nhiên, để tính một trong hai số liệu, trước tiên phải tính tổng bình phương. Phương sai là trung bình của tổng bình phương (nghĩa là tổng bình phương chia cho số lượng quan sát). Độ lệch chuẩn là căn bậc hai của phương sai.
Có hai phương pháp phân tích hồi quy sử dụng tổng bình phương: phương pháp bình phương tối thiểu tuyến tính và phương pháp bình phương tối thiểu phi tuyến tính. Phương pháp bình phương tối thiểu đề cập đến thực tế là hàm hồi quy giảm thiểu tổng bình phương của phương sai từ các điểm dữ liệu thực tế. Theo cách này, có thể vẽ một hàm thống kê cung cấp phù hợp nhất cho dữ liệu. Lưu ý rằng hàm hồi quy có thể là tuyến tính (đường thẳng) hoặc phi tuyến tính (đường cong).
