Bài kiểm tra hai đuôi là gì?
Trong thống kê, thử nghiệm hai đuôi là một phương pháp trong đó khu vực quan trọng của phân phối là hai mặt và kiểm tra xem một mẫu có lớn hơn hoặc nhỏ hơn một phạm vi giá trị nhất định hay không. Nó được sử dụng trong kiểm tra giả thuyết null và kiểm tra cho ý nghĩa thống kê. Nếu mẫu được kiểm tra rơi vào một trong các khu vực quan trọng, giả thuyết thay thế được chấp nhận thay vì giả thuyết khống. Thử nghiệm hai đuôi có tên từ thử nghiệm khu vực dưới cả hai đuôi của phân phối bình thường, mặc dù thử nghiệm có thể được sử dụng trong các phân phối không bình thường khác.
Chìa khóa chính
- Trong thống kê, thử nghiệm hai đuôi là một phương pháp trong đó khu vực quan trọng của phân phối là hai mặt và kiểm tra xem một mẫu có lớn hơn hoặc nhỏ hơn một phạm vi giá trị nhất định hay không. Nó được sử dụng trong thử nghiệm và kiểm tra giả thuyết null cho ý nghĩa thống kê. Nếu mẫu được kiểm tra rơi vào một trong các khu vực quan trọng, giả thuyết thay thế được chấp nhận thay vì giả thuyết null. Quy ước hai thử nghiệm được sử dụng để xác định mức ý nghĩa ở mức 5%, nghĩa là mỗi bên của phân phối được cắt ở mức 2, 5%.
Hãy cẩn thận lưu ý nếu kiểm tra thống kê là một hoặc hai đuôi vì điều này sẽ ảnh hưởng lớn đến việc giải thích mô hình.
Thử nghiệm hai đuôi cho ý nghĩa. Đầu tư
Cách thức kiểm tra hai đuôi hoạt động
Một khái niệm cơ bản của thống kê suy luận là kiểm tra giả thuyết, được chạy để xác định xem một tuyên bố có đúng hay không, đưa ra một tham số dân số. Một thử nghiệm được lập trình để cho biết giá trị trung bình của mẫu có lớn hơn và thấp hơn đáng kể so với giá trị trung bình của dân số hay không được gọi là thử nghiệm hai đuôi.
Một thử nghiệm hai đuôi được thiết kế để kiểm tra cả hai mặt của một phạm vi dữ liệu được chỉ định theo chỉ định của phân phối xác suất liên quan. Phân phối xác suất phải thể hiện khả năng của một kết quả được chỉ định dựa trên các tiêu chuẩn được xác định trước. Điều này đòi hỏi thiết lập giới hạn chỉ định các giá trị biến được chấp nhận cao nhất (hoặc trên) và thấp nhất (hoặc thấp hơn) được bao gồm trong phạm vi. Bất kỳ điểm dữ liệu nào tồn tại trên giới hạn trên hoặc dưới giới hạn dưới đều được xem là nằm ngoài phạm vi chấp nhận và trong một khu vực được gọi là phạm vi loại bỏ.
Không có tiêu chuẩn vốn có liên quan đến số lượng điểm dữ liệu phải tồn tại trong phạm vi chấp nhận. Trong trường hợp cần độ chính xác, chẳng hạn như trong việc tạo ra dược phẩm, tỷ lệ loại bỏ 0, 001% hoặc ít hơn có thể được thiết lập. Trong trường hợp độ chính xác ít quan trọng hơn, chẳng hạn như số lượng thực phẩm trong túi sản phẩm, tỷ lệ loại bỏ 5% có thể phù hợp.
Một ví dụ về bài kiểm tra hai đuôi
Như một ví dụ giả thuyết, hãy tưởng tượng rằng một nhà môi giới chứng khoán mới (XYZ) tuyên bố rằng phí môi giới của anh ta thấp hơn so với nhà môi giới chứng khoán hiện tại của bạn (ABC). Dữ liệu có sẵn từ một công ty nghiên cứu độc lập chỉ ra rằng độ lệch trung bình và độ lệch chuẩn của tất cả các khách hàng môi giới ABC lần lượt là $ 18 và $ 6.
Một mẫu gồm 100 khách hàng của ABC được lấy và phí môi giới được tính theo tỷ lệ mới của nhà môi giới XYZ. Nếu giá trị trung bình của mẫu là 18, 75 đô la và độ lệch chuẩn của mẫu là 6 đô la, liệu có thể suy luận về sự khác biệt trong hóa đơn môi giới trung bình giữa nhà môi giới ABC và XYZ không?
- H 0: Giả thuyết Null: mean = 18H 1: Giả thuyết thay thế: mean <> 18 (Đây là những gì chúng tôi muốn chứng minh.) Vùng loại bỏ: Z <= - Z 2.5 và Z> = Z 2.5 (giả sử mức ý nghĩa 5%, chia 2, 5 mỗi bên).Z = (trung bình mẫu - trung bình) / (std-dev / sqrt (số mẫu)) = (18, 75 - 18) / (6 / (sqrt (100)) = 1, 25
Giá trị Z được tính toán này nằm giữa hai giới hạn được xác định bởi: - Z 2.5 = -1.96 và Z 2.5 = 1.96.
Điều này kết luận rằng không có đủ bằng chứng để suy luận rằng có bất kỳ sự khác biệt nào giữa tỷ lệ của nhà môi giới hiện tại của bạn và nhà môi giới mới. Ngoài ra, giá trị p = P (Z <-1, 25) + P (Z> 1, 25) = 2 * 0, 1056 = 0, 2112 = 21, 12%, lớn hơn 0, 05 hoặc 5%, dẫn đến kết luận tương tự.
Cân nhắc đặc biệt: Lấy mẫu ngẫu nhiên
Một thử nghiệm hai đuôi cũng có thể được sử dụng thực tế trong các hoạt động sản xuất nhất định trong một công ty, chẳng hạn như với việc sản xuất và đóng gói kẹo tại một cơ sở cụ thể. Nếu cơ sở sản xuất chỉ định 50 kẹo mỗi túi là mục tiêu của mình, với phân phối chấp nhận được từ 45 đến 55 kẹo, thì bất kỳ túi nào được tìm thấy với số tiền dưới 45 hoặc trên 55 đều được xem xét trong phạm vi từ chối
Để xác nhận các cơ chế đóng gói được hiệu chuẩn đúng để đáp ứng đầu ra dự kiến, có thể lấy mẫu ngẫu nhiên để xác nhận độ chính xác. Để các cơ chế đóng gói được coi là chính xác, cần có trung bình 50 kẹo mỗi túi với phân phối thích hợp. Ngoài ra, số lượng túi nằm trong phạm vi loại bỏ cần nằm trong giới hạn phân phối xác suất được coi là chấp nhận được như một tỷ lệ lỗi.
Nếu tỷ lệ từ chối không được chấp nhận được phát hiện hoặc trung bình sai lệch quá xa so với giá trị trung bình mong muốn, có thể phải điều chỉnh thiết bị hoặc thiết bị đi kèm để sửa lỗi. Việc sử dụng thường xuyên các phương pháp thử nghiệm hai đuôi có thể giúp đảm bảo sản xuất nằm trong giới hạn trong thời gian dài.
Thử nghiệm hai đuôi Versus một đuôi
Khi kiểm tra giả thuyết được thiết lập để chỉ ra rằng giá trị trung bình mẫu sẽ cao hơn hoặc thấp hơn trung bình dân số, điều này được gọi là thử nghiệm một đầu. Thử nghiệm một đuôi có tên từ thử nghiệm khu vực dưới một trong các đuôi (các mặt) của phân phối bình thường. Khi sử dụng thử nghiệm một đầu, một nhà phân tích đang kiểm tra khả năng của mối quan hệ theo một hướng quan tâm và hoàn toàn không để ý đến khả năng của mối quan hệ theo hướng khác.
Nếu mẫu được kiểm tra rơi vào khu vực quan trọng một phía, giả thuyết thay thế sẽ được chấp nhận thay vì giả thuyết khống. Một thử nghiệm một đuôi cũng được gọi là một giả thuyết định hướng hoặc thử nghiệm định hướng.
