Mục lục
- Bài kiểm tra T là gì?
- Giải thích về bài kiểm tra T
- Kết quả kiểm tra mơ hồ
- Giả định kiểm tra T
- Tính toán T-Test
- Kiểm tra T tương quan (hoặc ghép đôi)
- Kiểm định bằng phương sai (gộp)
- Kiểm tra phương sai không đồng đều
- Xác định sử dụng thử nghiệm T
- Ví dụ kiểm tra phương sai không bằng nhau
Bài kiểm tra T là gì?
Thử nghiệm t là một loại thống kê suy luận được sử dụng để xác định xem có sự khác biệt đáng kể giữa phương tiện của hai nhóm hay không, có thể liên quan đến một số tính năng nhất định. Nó chủ yếu được sử dụng khi các bộ dữ liệu, như bộ dữ liệu được ghi là kết quả của việc lật một đồng xu 100 lần, sẽ tuân theo phân phối bình thường và có thể có các phương sai không xác định. Một thử nghiệm t được sử dụng như một công cụ kiểm tra giả thuyết, cho phép thử nghiệm một giả định áp dụng cho dân số.
Một thử nghiệm t xem xét thống kê t, các giá trị phân phối t và mức độ tự do để xác định xác suất chênh lệch giữa hai bộ dữ liệu. Để tiến hành kiểm tra với ba biến trở lên, người ta phải sử dụng phân tích phương sai.
Kiểm tra T
Giải thích về bài kiểm tra T
Về cơ bản, kiểm tra t cho phép chúng ta so sánh các giá trị trung bình của hai tập dữ liệu và xác định xem chúng có đến từ cùng một quần thể hay không. Trong các ví dụ trên, nếu chúng ta lấy một mẫu học sinh từ lớp A và một mẫu học sinh khác từ lớp B, chúng ta sẽ không mong đợi chúng có độ lệch chuẩn và trung bình chính xác như nhau. Tương tự, các mẫu được lấy từ nhóm đối chứng được cho ăn giả dược và các mẫu được lấy từ nhóm thuốc được kê đơn phải có độ lệch chuẩn và trung bình hơi khác nhau.
Về mặt toán học, kiểm tra t lấy một mẫu từ mỗi trong hai bộ và thiết lập báo cáo vấn đề bằng cách giả sử một giả thuyết khống rằng hai phương tiện bằng nhau. Dựa trên các công thức áp dụng, các giá trị nhất định được tính toán và so sánh với các giá trị tiêu chuẩn và giả thuyết null giả định được chấp nhận hoặc từ chối tương ứng.
Nếu giả thuyết null đủ điều kiện để bị từ chối, nó chỉ ra rằng việc đọc dữ liệu là mạnh mẽ và không phải là tình cờ. Bài kiểm tra t chỉ là một trong nhiều bài kiểm tra được sử dụng cho mục đích này. Các nhà thống kê phải sử dụng bổ sung các xét nghiệm khác với thử nghiệm t để kiểm tra nhiều biến số và thử nghiệm với cỡ mẫu lớn hơn. Đối với cỡ mẫu lớn, các nhà thống kê sử dụng phép thử z. Các tùy chọn kiểm tra khác bao gồm kiểm tra chi bình phương và kiểm tra f.
Có ba loại kiểm tra t, và chúng được phân loại là kiểm tra t phụ thuộc và kiểm tra độc lập.
Chìa khóa chính
- Thử nghiệm t là một loại thống kê suy luận được sử dụng để xác định xem có sự khác biệt đáng kể giữa phương tiện của hai nhóm hay không, có thể liên quan đến một số tính năng nhất định. Thử nghiệm t là một trong nhiều thử nghiệm được sử dụng cho mục đích kiểm tra giả thuyết trong thống kê. Việc tính toán kiểm tra t yêu cầu ba giá trị dữ liệu chính. Chúng bao gồm sự khác biệt giữa các giá trị trung bình từ mỗi bộ dữ liệu (được gọi là chênh lệch trung bình), độ lệch chuẩn của từng nhóm và số lượng giá trị dữ liệu của mỗi nhóm. Có một số loại kiểm tra t khác nhau có thể được thực hiện tùy thuộc vào trên dữ liệu và loại phân tích cần thiết.
Kết quả kiểm tra mơ hồ
Hãy xem xét rằng một nhà sản xuất thuốc muốn thử nghiệm một loại thuốc mới được phát minh. Nó tuân theo quy trình chuẩn thử thuốc trên một nhóm bệnh nhân và đưa giả dược cho một nhóm khác, được gọi là nhóm đối chứng. Giả dược được đưa cho nhóm đối chứng là một chất không có giá trị trị liệu dự định và đóng vai trò là chuẩn mực để đo lường cách nhóm khác, được cho dùng thuốc thực tế, đáp ứng.
Sau khi dùng thử thuốc, các thành viên của nhóm kiểm soát ăn giả dược đã báo cáo sự gia tăng tuổi thọ trung bình là ba năm, trong khi các thành viên của nhóm được kê đơn thuốc mới báo cáo tăng tuổi thọ trung bình bốn năm. Quan sát ngay lập tức có thể chỉ ra rằng thuốc thực sự hoạt động vì kết quả tốt hơn cho nhóm sử dụng thuốc. Tuy nhiên, cũng có thể quan sát có thể là do một cơ hội xảy ra, đặc biệt là một sự may mắn đáng ngạc nhiên. Một thử nghiệm t rất hữu ích để kết luận nếu kết quả thực sự chính xác và áp dụng cho toàn bộ dân số.
Trong một trường học, 100 học sinh lớp A đạt điểm trung bình 85% với độ lệch chuẩn là 3%. 100 học sinh khác thuộc lớp B đạt điểm trung bình 87% với độ lệch chuẩn là 4%. Mặc dù điểm trung bình của lớp B tốt hơn so với lớp A, nhưng có thể không đúng khi đưa ra kết luận rằng thành tích chung của học sinh lớp B tốt hơn so với học sinh lớp A. Điều này là do, cùng với có nghĩa là độ lệch chuẩn của lớp B cũng cao hơn so với lớp A. Nó chỉ ra rằng tỷ lệ phần trăm cực đoan của chúng, ở phía thấp hơn và cao hơn, được trải rộng hơn nhiều so với lớp A. Một bài kiểm tra t có thể giúp xác định Lớp nào tốt hơn.
Giả định kiểm tra T
- Giả định đầu tiên được đưa ra liên quan đến các bài kiểm tra t liên quan đến quy mô đo lường. Giả định cho kiểm tra t là thang đo được áp dụng cho dữ liệu được thu thập theo thang đo liên tục hoặc thứ tự, chẳng hạn như điểm số cho kiểm tra IQ. Giả định thứ hai được đưa ra là một mẫu ngẫu nhiên đơn giản, đó là dữ liệu được thu thập từ một đại diện, phần được chọn ngẫu nhiên trong tổng dân số. Giả định thứ ba là dữ liệu, khi được vẽ, dẫn đến phân phối bình thường, đường cong phân phối hình chuông. Giả định thứ tư là cỡ mẫu khá lớn được sử dụng. Cỡ mẫu lớn hơn có nghĩa là phân phối kết quả sẽ tiếp cận đường cong hình chuông bình thường. Giả định cuối cùng là tính đồng nhất của phương sai. Phương sai đồng nhất, hoặc bằng nhau, tồn tại khi độ lệch chuẩn của các mẫu xấp xỉ bằng nhau.
Tính toán T-Test
Tính toán kiểm tra t yêu cầu ba giá trị dữ liệu chính. Chúng bao gồm sự khác biệt giữa các giá trị trung bình từ mỗi bộ dữ liệu (được gọi là chênh lệch trung bình), độ lệch chuẩn của từng nhóm và số lượng giá trị dữ liệu của mỗi nhóm.
Kết quả của kiểm tra t tạo ra giá trị t. Giá trị t được tính toán này sau đó được so sánh với giá trị thu được từ bảng giá trị tới hạn (được gọi là Bảng phân phối T). So sánh này giúp xác định khả năng sự khác biệt giữa các phương tiện xảy ra do tình cờ hoặc liệu các bộ dữ liệu có thực sự có sự khác biệt nội tại hay không. Các câu hỏi kiểm tra t cho dù sự khác biệt giữa các nhóm đại diện cho một sự khác biệt thực sự trong nghiên cứu hoặc nếu nó có khả năng là một sự khác biệt thống kê vô nghĩa.
Bảng phân phối T
Bảng phân phối T có sẵn ở các định dạng một đuôi và hai đuôi. Cái trước được sử dụng để đánh giá các trường hợp có giá trị hoặc phạm vi cố định với hướng rõ ràng (tích cực hoặc tiêu cực). Chẳng hạn, xác suất của giá trị đầu ra còn lại dưới -3 là bao nhiêu, hoặc nhận được nhiều hơn bảy khi gieo một con xúc xắc? Cái sau được sử dụng để phân tích ràng buộc phạm vi, chẳng hạn như hỏi nếu tọa độ rơi vào giữa -2 và +2.
Các tính toán có thể được thực hiện với các chương trình phần mềm tiêu chuẩn hỗ trợ các chức năng thống kê cần thiết, giống như các chương trình được tìm thấy trong MS Excel.
Giá trị T và Độ tự do
Thử nghiệm t tạo ra hai giá trị là đầu ra của nó: giá trị t và mức độ tự do. Giá trị t là tỷ lệ chênh lệch giữa giá trị trung bình của hai bộ mẫu và chênh lệch tồn tại trong các bộ mẫu. Mặc dù giá trị tử số (chênh lệch giữa giá trị trung bình của hai bộ mẫu) rất đơn giản để tính toán, mẫu số (sự khác biệt tồn tại trong các bộ mẫu) có thể trở nên phức tạp một chút tùy thuộc vào loại giá trị dữ liệu liên quan. Mẫu số của tỷ lệ là một phép đo độ phân tán hoặc độ biến thiên. Giá trị cao hơn của giá trị t, còn được gọi là điểm t, chỉ ra rằng có sự khác biệt lớn giữa hai bộ mẫu. Giá trị t càng nhỏ, sự tương đồng tồn tại giữa hai bộ mẫu càng nhiều.
- Điểm t lớn cho thấy các nhóm khác nhau. Điểm t nhỏ cho thấy các nhóm tương tự nhau.
Độ tự do đề cập đến các giá trị trong một nghiên cứu có quyền tự do thay đổi và rất cần thiết để đánh giá tầm quan trọng và tính hợp lệ của giả thuyết null. Tính toán của các giá trị này thường phụ thuộc vào số lượng bản ghi dữ liệu có sẵn trong bộ mẫu.
Kiểm tra T tương quan (hoặc ghép đôi)
Thử nghiệm t tương quan được thực hiện khi các mẫu thường bao gồm các cặp đơn vị tương tự hoặc khi có các trường hợp đo lặp lại. Ví dụ, có thể có những trường hợp của cùng một bệnh nhân được xét nghiệm nhiều lần trước và sau khi được điều trị cụ thể. Trong những trường hợp như vậy, mỗi bệnh nhân đang được sử dụng như một mẫu đối chứng với chính họ.
Phương pháp này cũng áp dụng cho các trường hợp các mẫu có liên quan theo một cách nào đó hoặc có các đặc điểm phù hợp, như phân tích so sánh liên quan đến trẻ em, cha mẹ hoặc anh chị em. Các thử nghiệm t tương quan hoặc ghép nối thuộc loại phụ thuộc, vì các thử nghiệm này liên quan đến các trường hợp trong đó hai bộ mẫu có liên quan.
Công thức tính giá trị t và bậc tự do cho phép thử t được ghép nối là:
- Mean1 và mean2 là các giá trị trung bình của từng bộ mẫu, trong khi var1 và var2 đại diện cho phương sai của từng bộ mẫu.
Hai loại còn lại thuộc về các bài kiểm tra t độc lập. Các mẫu của các loại này được chọn độc lập với nhau, đó là các bộ dữ liệu trong hai nhóm không tham chiếu đến cùng các giá trị. Chúng bao gồm các trường hợp như một nhóm 100 bệnh nhân được chia thành hai nhóm 50 bệnh nhân mỗi nhóm. Một trong các nhóm trở thành nhóm đối chứng và được cho dùng giả dược, trong khi nhóm còn lại được điều trị theo quy định. Điều này tạo thành hai nhóm mẫu độc lập không ghép đôi với nhau.
Kiểm tra bằng phương sai (hoặc gộp)
Phép thử t phương sai bằng nhau được sử dụng khi số lượng mẫu trong mỗi nhóm là như nhau hoặc phương sai của hai bộ dữ liệu là tương tự nhau. Công thức sau đây được sử dụng để tính giá trị t và bậc tự do cho phép thử t phương sai bằng nhau:
Hay nói, là một tài tài của, qua, qua, qua một tài khác, qua giữ, qua một tài khác T-value = n1 + n2−2 (n1−1) × var12 + (n2−1) × var22 × n11 + n21 mean1 − mean2 trong đó: mean1 và mean2 = Giá trị trung bình của mỗi mẫu của tập hợp mẫu1 và var2 = Phương sai của từng bộ mẫun1 và n2 = Số lượng bản ghi trong mỗi bộ mẫu
và, Hay nói, là một tài tài của, qua, qua, qua một tài khác, qua giữ, qua một tài khác Độ tự do = n1 + n2−2where: n1 và n2 = Số lượng hồ sơ trong mỗi bộ mẫu
Kiểm tra phương sai không đồng đều
Phép thử t phương sai không bằng nhau được sử dụng khi số lượng mẫu trong mỗi nhóm là khác nhau và phương sai của hai bộ dữ liệu cũng khác nhau. Thử nghiệm này cũng được gọi là thử nghiệm t của Welch. Công thức sau đây được sử dụng để tính giá trị t và mức độ tự do cho phép kiểm tra phương sai không bằng nhau:
Hay nói, là một tài tài của, qua, qua, qua một tài khác, qua giữ, qua một tài khác T-value = n1var12 + n2var22 mean1 − mean2 trong đó: mean1 và mean2 = Giá trị trung bình của mỗi mẫu của tập hợp mẫu1 và var2 = Phương sai của từng bộ mẫun1 và n2 = Số lượng bản ghi trong mỗi bộ mẫu
và, Hay nói, là một tài tài của, qua, qua, qua một tài khác, qua giữ, qua một tài khác Độ tự do = n1−1 (n1var12) 2 + n2−1 (n2var22) 2 (n1var12 + n2var22) 2 trong đó: var1 và var2 = Phương sai của từng mẫu đặtn1 và n2 = Số hồ sơ trong mỗi bộ mẫu
Xác định đúng T-Test để sử dụng
Lưu đồ sau đây có thể được sử dụng để xác định thử nghiệm t nào nên được sử dụng dựa trên các đặc tính của các bộ mẫu. Các mục chính được xem xét bao gồm liệu các bản ghi mẫu có giống nhau không, số lượng bản ghi dữ liệu trong mỗi bộ mẫu và phương sai của từng bộ mẫu.
Hình ảnh của Julie Bang © Investopedia 2019
Ví dụ kiểm tra phương sai không bằng nhau
Giả sử rằng chúng ta đang thực hiện một phép đo đường chéo của các bức tranh nhận được trong một phòng trưng bày nghệ thuật. Một nhóm mẫu bao gồm 10 bức tranh, trong khi nhóm kia bao gồm 20 bức tranh. Các tập dữ liệu, với các giá trị trung bình và phương sai tương ứng, như sau:
Hiệp 1 | Đặt 2 | |
19, 7 | 28.3 | |
20, 4 | 26, 7 | |
19, 6 | 20.1 | |
17.8 | 23.3 | |
18, 5 | 25.2 | |
18, 9 | 22.1 | |
18.3 | 17, 7 | |
18, 9 | 27, 6 | |
19, 5 | 20, 6 | |
21, 95 | 13, 7 | |
23.2 | ||
17, 5 | ||
20, 6 | ||
18 | ||
23, 9 | ||
21, 6 | ||
24.3 | ||
20, 4 | ||
23, 9 | ||
13.3 | ||
Nghĩa là | 19, 4 | 21, 6 |
Phương sai | 1, 4 | 17.1 |
Mặc dù giá trị trung bình của Bộ 2 cao hơn Bộ 1, nhưng chúng tôi không thể kết luận rằng tất cả các bức tranh có chiều dài trung bình khoảng 21, 6 đơn vị do phương sai của Bộ 2 cao hơn đáng kể so với Bộ 1. Đây có phải là sự khác biệt hay là sự khác biệt thực sự tồn tại trong tổng thể của tất cả các bức tranh nhận được trong phòng trưng bày nghệ thuật? Chúng tôi thiết lập vấn đề bằng cách giả sử giả thuyết null rằng giá trị trung bình là giống nhau giữa hai bộ mẫu và tiến hành kiểm tra t để xác nhận xem giả thuyết có đúng không.
Do số lượng bản ghi dữ liệu là khác nhau (n1 = 10 và n2 = 20) và phương sai cũng khác nhau, giá trị t và mức độ tự do được tính cho tập dữ liệu trên bằng cách sử dụng công thức được đề cập trong Kiểm tra phương sai phương sai không bằng nhau phần.
Giá trị t là -2.24787. Vì dấu trừ có thể bị bỏ qua khi so sánh hai giá trị t, nên giá trị được tính là 2.24787.
Độ của giá trị tự do là 24, 38 và giảm xuống còn 24, do định nghĩa công thức yêu cầu làm tròn giá trị thành giá trị nguyên nhỏ nhất có thể.
Bất cứ khi nào một phân phối bình thường được giả định, người ta có thể chỉ định một mức xác suất (mức alpha, mức ý nghĩa, p ) làm tiêu chí chấp nhận. Trong hầu hết các trường hợp, giá trị 5% có thể được giả định.
Sử dụng mức độ của giá trị tự do là 24 và mức ý nghĩa 5%, xem bảng phân phối giá trị t cho giá trị 2.064. So sánh giá trị này với giá trị tính toán của 2.247 chỉ ra rằng giá trị t được tính lớn hơn giá trị bảng ở mức ý nghĩa 5%. Do đó, an toàn khi bác bỏ giả thuyết khống rằng không có sự khác biệt giữa các phương tiện. Tập hợp dân số có sự khác biệt nội tại, và chúng không phải là tình cờ.
So sánh các tài khoản đầu tư × Các ưu đãi xuất hiện trong bảng này là từ các mối quan hệ đối tác mà Investopedia nhận được bồi thường. Tên nhà cung cấp Mô tảĐiều khoản liên quan
Cách phân tích phương sai (ANOVA) Phân tích phương sai (ANOVA) là một công cụ phân tích thống kê phân tách tổng biến thiên được tìm thấy trong một tập dữ liệu thành hai thành phần: các yếu tố ngẫu nhiên và hệ thống. thêm Định nghĩa Z-Test Một thử nghiệm z là một thử nghiệm thống kê được sử dụng để xác định xem hai phương tiện dân số có khác nhau hay không khi phương sai được biết và kích thước mẫu lớn. Nhiều bậc tự do Định nghĩa Độ tự do đề cập đến số lượng giá trị độc lập logic tối đa, là các giá trị có quyền tự do thay đổi, trong mẫu dữ liệu. hiểu thêm Phân phối T Phân phối AT là một loại hàm xác suất phù hợp để ước tính các tham số dân số cho các cỡ mẫu nhỏ hoặc phương sai không xác định. thêm Những gì các biện pháp bán lệch Độ lệch bán là một phương pháp đánh giá các biến động trung bình dưới đây trong lợi tức đầu tư. Nó được sử dụng như là một thay thế cho độ lệch chuẩn. thêm Bonferroni Test Thử nghiệm Bonferroni là một loại thử nghiệm so sánh được sử dụng trong phân tích thống kê. thêm Liên kết đối tácNhững bài viết liên quan
Kinh tế học
Những giả định nào được đưa ra khi tiến hành kiểm tra t?
Quản lý rủi ro
Sử dụng biến động lịch sử để đánh giá rủi ro trong tương lai
Chiến lược giao dịch và giáo dục chứng khoán
Cách sử dụng Excel để mô phỏng giá cổ phiếu
Chỉ số tài chính
Làm thế nào để bạn tính toán IRR trong Excel?
Toán & Thống kê
Lỗi tiêu chuẩn tương đối là gì
Chỉ số tài chính
Công thức tính giá trị hiện tại ròng (NPV) trong Excel là gì?
