Homoskedastic là gì?
Homoskedastic (cũng được đánh vần là "homoscedastic") đề cập đến một điều kiện trong đó phương sai của phần dư hoặc thuật ngữ lỗi trong mô hình hồi quy là không đổi. Đó là, thuật ngữ lỗi không thay đổi nhiều khi giá trị của biến dự đoán thay đổi. Tuy nhiên, việc thiếu tính đồng nhất có thể gợi ý rằng mô hình hồi quy có thể cần bao gồm các biến dự đoán bổ sung để giải thích hiệu suất của biến phụ thuộc.
Chìa khóa chính
- Homoskedasticity xảy ra khi phương sai của thuật ngữ lỗi trong mô hình hồi quy là không đổi. Nếu phương sai của thuật ngữ lỗi là homoskedastic, mô hình đã được xác định rõ. Nếu có quá nhiều phương sai, mô hình có thể không được xác định rõ. Thêm các biến dự đoán bổ sung có thể giúp giải thích hiệu suất của biến phụ thuộc. Thực tế, tính không đồng nhất xảy ra khi phương sai của thuật ngữ lỗi không phải là hằng số.
Homoskedastic hoạt động như thế nào
Homoskedasticity là một giả định của mô hình hồi quy tuyến tính. Nếu phương sai của các lỗi xung quanh đường hồi quy thay đổi nhiều, mô hình hồi quy có thể được xác định kém. Trái ngược với tính đồng nhất là tính không đồng nhất giống như tính đối lập của "đồng nhất" là "không đồng nhất". Heteroskedasticity (cũng được đánh vần là heteroscedasticity) đề cập đến một điều kiện trong đó phương sai của thuật ngữ lỗi trong phương trình hồi quy không phải là hằng số.
Khi xem xét phương sai đó là sự khác biệt đo được giữa kết quả dự đoán và kết quả thực tế của một tình huống nhất định, việc xác định tính đồng nhất có thể giúp xác định các yếu tố nào cần được điều chỉnh cho chính xác.
Cân nhắc đặc biệt
Một mô hình hồi quy đơn giản, hoặc phương trình, bao gồm bốn thuật ngữ. Ở phía bên trái là biến phụ thuộc. Nó đại diện cho hiện tượng mà người mẫu tìm cách "giải thích". Ở phía bên phải là một hằng số, một biến dự đoán và một số dư hoặc lỗi. Thuật ngữ lỗi cho thấy mức độ biến đổi trong biến phụ thuộc không được giải thích bởi biến dự đoán.
Ví dụ về Homoskedastic
Ví dụ: giả sử bạn muốn giải thích điểm kiểm tra của sinh viên bằng cách sử dụng lượng thời gian mỗi sinh viên dành cho việc học. Trong trường hợp này, điểm kiểm tra sẽ là biến phụ thuộc và thời gian nghiên cứu sẽ là biến dự đoán.
Thuật ngữ lỗi sẽ hiển thị lượng phương sai trong điểm kiểm tra không được giải thích bằng thời gian học. Nếu phương sai đó là đồng nhất, hoặc homoskedastic, thì điều đó cho thấy mô hình có thể là một lời giải thích thỏa đáng cho hiệu suất thử nghiệm, giải thích nó về thời gian nghiên cứu.
Nhưng phương sai có thể không đồng nhất. Một biểu đồ của dữ liệu thuật ngữ lỗi có thể cho thấy một lượng lớn thời gian nghiên cứu tương ứng rất chặt chẽ với điểm kiểm tra cao nhưng điểm kiểm tra thời gian nghiên cứu thấp rất khác nhau và thậm chí bao gồm một số điểm rất cao. Vì vậy, phương sai của điểm số sẽ không được giải thích rõ ràng chỉ bằng một biến dự đoán, số lượng thời gian nghiên cứu. Trong trường hợp này, một số yếu tố khác có thể đang hoạt động và mô hình có thể cần được tăng cường để xác định nó hoặc chúng. Điều tra sâu hơn có thể cho thấy rằng một số sinh viên đã nhìn thấy câu trả lời cho bài kiểm tra trước thời hạn hoặc trước đó họ đã thực hiện một bài kiểm tra tương tự, và do đó không cần phải nghiên cứu cho bài kiểm tra cụ thể này.
Do đó, để cải thiện mô hình hồi quy, nhà nghiên cứu sẽ thêm một biến giải thích khác cho biết liệu một sinh viên đã nhìn thấy câu trả lời trước khi thử nghiệm. Mô hình hồi quy sau đó sẽ có hai biến giải thích Thời gian học và liệu học sinh có kiến thức trước về câu trả lời hay không. Với hai biến này, phần lớn phương sai của điểm kiểm tra sẽ được giải thích và phương sai của thuật ngữ lỗi có thể là homoskedastic, cho thấy mô hình đã được xác định rõ.
