Phân phối T là gì?
Phân phối T, còn được gọi là phân phối t của Học sinh, là một loại phân phối xác suất tương tự như phân phối bình thường với hình dạng chuông của nó nhưng có đuôi nặng hơn. Các bản phân phối T có cơ hội lớn hơn cho các giá trị cực trị so với các bản phân phối bình thường, do đó các đuôi béo hơn.
Chìa khóa chính
- Phân phối T là phân phối xác suất liên tục của điểm z khi độ lệch chuẩn ước tính được sử dụng trong mẫu số thay vì độ lệch chuẩn thực. Phân phối T, giống như phân phối chuẩn, có dạng hình chuông và đối xứng, nhưng nó nặng hơn đuôi, có nghĩa là nó có xu hướng tạo ra các giá trị nằm xa mức trung bình của nó. Các thử nghiệm được sử dụng trong thống kê để ước tính tầm quan trọng.
Phân phối T cho bạn biết điều gì?
Độ nặng của đuôi được xác định bởi một tham số của phân bố T được gọi là bậc tự do, với các giá trị nhỏ hơn cho đuôi nặng hơn và với các giá trị cao hơn làm cho phân phối T giống với phân phối chuẩn thông thường với giá trị trung bình là 0 và độ lệch chuẩn là 1. Phân phối T còn được gọi là "Phân phối T của sinh viên."
Vùng màu xanh minh họa một bài kiểm tra giả thuyết hai đuôi. CKTaylor
Khi một mẫu quan sát n được lấy từ một quần thể phân bố bình thường có trung bình M và độ lệch chuẩn D, giá trị trung bình mẫu, m và độ lệch chuẩn của mẫu, d, sẽ khác với M và D vì tính ngẫu nhiên của mẫu.
Điểm z có thể được tính với độ lệch chuẩn dân số là Z = (m - M) / {D / sqrt (n)} và giá trị này có phân phối chuẩn với trung bình 0 và độ lệch chuẩn 1. Nhưng khi z- điểm được tính bằng độ lệch chuẩn ước tính, cho T = (m - M) / {d / sqrt (n)}, sự khác biệt giữa d và D làm cho phân phối T phân phối với (n - 1) bậc tự do thay vì phân phối chuẩn với trung bình 0 và độ lệch chuẩn 1.
Ví dụ về Cách sử dụng phân phối T
Lấy ví dụ sau để biết cách phân phối t được sử dụng trong phân tích thống kê. Đầu tiên, hãy nhớ rằng khoảng tin cậy cho giá trị trung bình là một phạm vi các giá trị, được tính toán từ dữ liệu, có nghĩa là để nắm bắt trung bình dân số Hồi giáo. Khoảng này là m + - t * d / sqrt (n), trong đó t là giá trị tới hạn từ phân bố T.
Chẳng hạn, khoảng tin cậy 95% cho lợi nhuận trung bình của Trung bình công nghiệp Dow Jones trong 27 ngày giao dịch trước ngày 9/11/2001, là -0, 33%, (+/- 2.055) * 1.07 / sqrt (27), mang lại lợi nhuận (liên tục) có nghĩa là một số từ -0, 75% đến + 0, 09%. Số 2.055, số lượng lỗi tiêu chuẩn cần điều chỉnh, được tìm thấy từ phân phối T.
Bởi vì phân phối T có đuôi dài hơn phân phối bình thường, nên nó có thể được sử dụng như một mô hình cho lợi nhuận tài chính thể hiện sự kurtosis dư thừa, điều này sẽ cho phép tính toán Giá trị Rủi ro (VaR) thực tế hơn trong những trường hợp như vậy.
Sự khác biệt giữa phân phối T và phân phối bình thường
Phân phối bình thường được sử dụng khi phân phối dân số được coi là bình thường. Phân phối T tương tự như phân phối bình thường, chỉ với đuôi béo hơn. Cả hai đều giả định một dân số phân phối bình thường. Phân phối T có mức độ tổn thương cao hơn so với phân phối bình thường. Xác suất nhận được các giá trị rất xa giá trị trung bình là lớn hơn với phân phối T so với phân phối bình thường.
Hạn chế của việc sử dụng phân phối T
Phân phối T có thể sai lệch độ chính xác so với phân phối bình thường. Thiếu sót của nó chỉ phát sinh khi cần một sự bình thường hoàn hảo. Tuy nhiên, sự khác biệt giữa việc sử dụng phân phối bình thường và T là tương đối nhỏ.
