Ý nghĩa của Winsorized là gì?
Winsorized mean là một phương pháp lấy trung bình ban đầu thay thế các giá trị nhỏ nhất và lớn nhất bằng các quan sát gần nhất với chúng. Điều này được thực hiện để hạn chế ảnh hưởng của các giá trị cực trị bất thường, hoặc ngoại lệ, đối với phép tính. Sau khi thay thế các giá trị, công thức trung bình số học được sử dụng để tính giá trị trung bình thắng.
Công thức cho nghĩa trung bình là
Hay nói, là một tài tài của, qua, qua, qua một tài khác, qua giữ, qua một tài khác Winsorized mean = Nxn lệch xn + 1 + xn + 2io xn trong đó: n = Số lượng điểm dữ liệu lớn nhất và nhỏ nhất được thay thế bằng quan sát
Phương tiện Winsorized được thể hiện theo hai cách. Giá trị trung bình "k n " có nghĩa là thay thế các quan sát nhỏ nhất và lớn nhất 'k', trong đó 'k' là một số nguyên. Giá trị trung bình "X%" có nghĩa là thay thế một tỷ lệ phần trăm nhất định của các giá trị từ cả hai đầu của dữ liệu.
Cách tính giá trị trung bình
Giá trị trung bình được tính bằng cách thay thế các điểm dữ liệu nhỏ nhất và lớn nhất, sau đó tổng hợp tất cả các điểm dữ liệu và chia tổng cho tổng số điểm dữ liệu.
Winsorized có nghĩa là gì cho bạn biết?
Giá trị trung bình chiến thắng ít nhạy cảm hơn với các ngoại lệ vì nó có thể thay thế chúng bằng các giá trị cực trị ít hơn. Đó là, nó ít nhạy cảm với các phác thảo so với giá trị trung bình. Tuy nhiên, nếu một phân phối có đuôi béo, hiệu ứng loại bỏ các giá trị cao nhất và thấp nhất trong phân phối sẽ có ít ảnh hưởng vì số lượng biến động cao trong các số liệu phân phối.
Chìa khóa chính
- Một phương pháp tính trung bình bao gồm thay thế các giá trị nhỏ nhất và lớn nhất bằng các quan sát gần nhất với chúng. Rất nhạy cảm với các ngoại lệ vì nó có thể thay thế chúng bằng các giá trị cực trị ít hơn. Nó không giống như ý nghĩa được cắt xén, bao gồm loại bỏ các điểm dữ liệu mặc dù kết quả của hai có xu hướng gần gũi.
Ví dụ về cách sử dụng Winsorized có nghĩa là
Người ta có thể tính giá trị trung bình thắng cho tập dữ liệu sau: 1, 5, 7, 8, 9, 10, 14. Trong ví dụ này, chúng tôi giả sử giá trị trung bình thắng là theo thứ tự đầu tiên, chúng tôi thay thế các giá trị nhỏ nhất và lớn nhất bằng quan sát gần nhất.
Bây giờ bộ dữ liệu xuất hiện như sau: 5, 5, 7, 8, 9, 10, 10. Lấy trung bình số học của tập hợp mới tạo ra giá trị trung bình thắng là 7, 7 hoặc (5 + 5 + 7 + 8 + 9 + 10 + 10) chia cho 7.
Hoặc xem xét tỷ lệ thắng 20% có nghĩa là chiếm 10% hàng đầu và 10% dưới cùng và thay thế chúng bằng giá trị gần nhất tiếp theo của chúng. Chúng tôi sẽ thắng các bộ dữ liệu sau: 2, 4, 7, 8, 11, 14, 18, 23, 23, 27, 35, 40, 49, 50, 55, 60, 61, 61, 62, 75. Hai điểm dữ liệu nhỏ nhất và lớn nhất, hoặc 10%, sẽ được thay thế bằng giá trị gần nhất tiếp theo của chúng. Do đó, bộ dữ liệu mới là: 7, 7, 7, 8, 11, 14, 18, 23, 23, 27, 35, 40, 49, 50, 55, 60, 61, 61, 61, 61. Người chiến thắng giá trị trung bình là 33, 9 hoặc tổng dữ liệu (678) chia cho tổng số điểm dữ liệu (20).
Sự khác biệt giữa trung bình Winsorized và trung bình cắt
Giá trị trung bình thắng bao gồm sửa đổi điểm dữ liệu, trong khi giá trị trung bình được cắt xén bao gồm loại bỏ điểm dữ liệu. Nó là phổ biến cho trung bình thắng và cắt nghĩa là gần.
Hạn chế của việc sử dụng Winsorized có nghĩa là
Một nhược điểm lớn đối với các phương tiện chiến thắng là chúng đưa ra sự thiên vị vào tập dữ liệu. Cấp, bộ dữ liệu lý tưởng là ít sai lệch sau khi sửa đổi so với nếu các ngoại lệ được để lại.
Tìm hiểu thêm về ý nghĩa của Winsorized
Đối với cái nhìn sâu sắc liên quan, về sự khác biệt giữa các tính toán trung bình chính.
