Thống kê không đối xứng là gì?
Thống kê phi tham số đề cập đến một phương pháp thống kê trong đó dữ liệu không bắt buộc phải phù hợp với phân phối bình thường. Số liệu thống kê phi tham số sử dụng dữ liệu thường là thông thường, có nghĩa là nó không dựa vào các con số, mà dựa trên xếp hạng hoặc thứ tự sắp xếp. Ví dụ: một cuộc khảo sát chuyển tải sở thích của người tiêu dùng từ thích đến không thích sẽ được coi là dữ liệu thứ tự.
Thống kê phi tham số bao gồm thống kê mô tả không đối xứng, mô hình thống kê, suy luận và kiểm tra thống kê. Cấu trúc mô hình của các mô hình không tham số không được chỉ định trước mà thay vào đó được xác định từ dữ liệu. Thuật ngữ không tham số không có nghĩa là các mô hình như vậy hoàn toàn thiếu các tham số, mà là số lượng và bản chất của các tham số là linh hoạt và không cố định trước. Biểu đồ là một ví dụ về ước tính không đối xứng của phân phối xác suất.
Hiểu số liệu thống kê phi trắc nghiệm
Trong thống kê, thống kê tham số bao gồm các tham số như giá trị trung bình, trung vị, độ lệch chuẩn, phương sai, v.v… Dạng thống kê này sử dụng dữ liệu quan sát để ước tính các tham số của phân phối. Theo thống kê tham số, dữ liệu được giả sử phù hợp với phân phối bình thường với các tham số chưa biết μ (trung bình dân số) và σ 2 (phương sai dân số), sau đó được ước tính bằng trung bình mẫu và phương sai mẫu.
Thống kê phi tham số làm cho không có giả định về kích thước mẫu hoặc liệu dữ liệu quan sát được là định lượng.
Số liệu thống kê phi tham số không cho rằng dữ liệu được rút ra từ một phân phối bình thường. Thay vào đó, hình dạng của phân phối được ước tính dưới dạng đo lường thống kê này. Mặc dù có nhiều tình huống trong đó phân phối bình thường có thể được giả định, nhưng cũng có một số tình huống trong đó sẽ không thể xác định liệu dữ liệu sẽ được phân phối bình thường hay không.
Ví dụ về thống kê không đối xứng
Trong ví dụ đầu tiên, hãy xem xét một nhà nghiên cứu muốn ước tính số lượng trẻ sơ sinh ở Bắc Mỹ sinh ra với đôi mắt nâu có thể quyết định lấy mẫu 150.000 em bé và tiến hành phân tích dữ liệu. Phép đo mà chúng lấy được sẽ được sử dụng như một ước tính của toàn bộ dân số trẻ có mắt nâu được sinh ra vào năm sau.
Ví dụ thứ hai, hãy xem xét một nhà nghiên cứu khác muốn biết việc đi ngủ sớm hay muộn có liên quan đến tần suất một người bị bệnh. Giả sử mẫu được chọn ngẫu nhiên từ dân số, phân bố cỡ mẫu của tần suất bệnh có thể được coi là bình thường. Tuy nhiên, một thí nghiệm đo sức đề kháng của cơ thể con người với một chủng vi khuẩn có thể được coi là có phân phối bình thường.
Điều này là do dữ liệu mẫu được chọn ngẫu nhiên có thể chống lại biến dạng. Mặt khác, nếu nhà nghiên cứu xem xét các yếu tố như trang điểm di truyền và dân tộc, anh ta có thể thấy rằng một cỡ mẫu được chọn sử dụng các đặc điểm này có thể không chịu được chủng. Do đó, người ta không thể giả định một phân phối bình thường.
Phương pháp này hữu ích khi dữ liệu không có giải thích số rõ ràng và tốt nhất nên sử dụng với dữ liệu có thứ hạng sắp xếp. Ví dụ: bài kiểm tra đánh giá tính cách có thể có một bảng xếp hạng các số liệu được đặt là không đồng ý, không đồng ý, thờ ơ, đồng ý và đồng ý mạnh mẽ. Trong trường hợp này, nên sử dụng các phương pháp không tham số.
Cân nhắc đặc biệt
Số liệu thống kê phi tham số đã đạt được sự đánh giá cao do dễ sử dụng. Khi nhu cầu về các tham số được giải tỏa, dữ liệu sẽ trở nên phù hợp hơn với nhiều thử nghiệm lớn hơn. Loại thống kê này có thể được sử dụng mà không có giá trị trung bình, cỡ mẫu, độ lệch chuẩn hoặc ước tính của bất kỳ tham số liên quan nào khác khi không có thông tin nào có sẵn.
Vì thống kê không theo tham số làm cho ít giả định hơn về dữ liệu mẫu, nên ứng dụng của nó có phạm vi rộng hơn so với thống kê tham số. Trong trường hợp kiểm tra tham số phù hợp hơn, các phương pháp không tham số sẽ kém hiệu quả hơn. Điều này là do các kết quả thu được từ số liệu thống kê không theo tỷ lệ có độ tin cậy thấp hơn so với kết quả thu được bằng cách sử dụng số liệu thống kê tham số.
Chìa khóa chính
- Thống kê phi tham số rất dễ sử dụng nhưng không cung cấp độ chính xác chính xác của các mô hình thống kê khác. Loại phân tích này phù hợp nhất khi xem xét thứ tự của một thứ gì đó, ngay cả khi dữ liệu số thay đổi, kết quả có thể sẽ giữ nguyên.
