Phân tích phương sai (ANOVA) là gì?
Phân tích phương sai (ANOVA) là một công cụ phân tích được sử dụng trong các số liệu thống kê phân tách biến thiên tổng hợp quan sát được tìm thấy bên trong một tập dữ liệu thành hai phần: các yếu tố hệ thống và các yếu tố ngẫu nhiên. Các yếu tố hệ thống có ảnh hưởng thống kê đến tập dữ liệu đã cho, trong khi các yếu tố ngẫu nhiên thì không. Các nhà phân tích sử dụng thử nghiệm ANOVA để xác định ảnh hưởng của các biến độc lập đối với biến phụ thuộc trong nghiên cứu hồi quy.
Các phương pháp thử nghiệm t và z được phát triển trong thế kỷ 20 đã được sử dụng để phân tích thống kê cho đến năm 1918, khi Ronald Fisher tạo ra phân tích phương pháp phương sai. ANOVA còn được gọi là phân tích phương sai Fisher, và nó là phần mở rộng của các bài kiểm tra t và z. Thuật ngữ này trở nên nổi tiếng vào năm 1925, sau khi xuất hiện trong cuốn sách của Fisher, "Phương pháp thống kê cho công nhân nghiên cứu". Nó được sử dụng trong tâm lý học thực nghiệm và sau đó mở rộng sang các đối tượng phức tạp hơn.
Công thức cho ANOVA là:
Hay nói, là một tài tài của, qua, qua, qua một tài khác, qua giữ, qua một tài khác F = MSEMST trong đó: F = ANOVA hệ sốMST = Tổng bình phương trung bình do điều trịMSE = Tổng bình phương trung bình do lỗi
Phân tích phương sai tiết lộ điều gì?
Thử nghiệm ANOVA là bước đầu tiên trong việc phân tích các yếu tố ảnh hưởng đến một tập dữ liệu nhất định. Sau khi thử nghiệm kết thúc, một nhà phân tích thực hiện thử nghiệm bổ sung về các yếu tố phương pháp đóng góp đáng kể vào sự không nhất quán của tập dữ liệu. Nhà phân tích sử dụng kết quả kiểm tra ANOVA trong thử nghiệm f để tạo dữ liệu bổ sung phù hợp với các mô hình hồi quy được đề xuất.
Thử nghiệm ANOVA cho phép so sánh nhiều hơn hai nhóm cùng một lúc để xác định xem mối quan hệ có tồn tại giữa chúng hay không. Kết quả của công thức ANOVA, thống kê F (còn gọi là tỷ lệ F), cho phép phân tích nhiều nhóm dữ liệu để xác định độ biến thiên giữa các mẫu và trong các mẫu.
Nếu không có sự khác biệt thực sự giữa các nhóm được thử nghiệm, được gọi là giả thuyết null, kết quả của thống kê tỷ lệ F của ANOVA sẽ gần bằng 1. Biến động trong lấy mẫu của nó có thể sẽ tuân theo phân phối của Fisher F. Đây thực sự là một nhóm các hàm phân phối, với hai số đặc trưng, được gọi là bậc tự do của tử số và bậc tự do của mẫu số.
Chìa khóa chính
- Phân tích phương sai, hay ANOVA, là một phương pháp thống kê phân tách dữ liệu phương sai quan sát thành các thành phần khác nhau để sử dụng cho các thử nghiệm bổ sung. ANOVA một chiều được sử dụng cho ba hoặc nhiều nhóm dữ liệu, để có được thông tin về mối quan hệ giữa người phụ thuộc và các biến độc lập. Nếu không có phương sai thực sự tồn tại giữa các nhóm, tỷ lệ F của ANOVA phải gần bằng 1.
Ví dụ về Cách sử dụng ANOVA
Một nhà nghiên cứu có thể, ví dụ, kiểm tra sinh viên từ nhiều trường đại học để xem liệu sinh viên từ một trong các trường đại học luôn vượt trội so với sinh viên từ các trường đại học khác. Trong một ứng dụng kinh doanh, một nhà nghiên cứu R & D có thể thử nghiệm hai quy trình tạo sản phẩm khác nhau để xem liệu một quy trình có tốt hơn quy trình kia về hiệu quả chi phí hay không.
Loại thử nghiệm ANOVA được sử dụng phụ thuộc vào một số yếu tố. Nó được áp dụng khi dữ liệu cần phải được thử nghiệm. Phân tích phương sai được sử dụng nếu không có quyền truy cập vào phần mềm thống kê dẫn đến tính toán ANOVA bằng tay. Nó là đơn giản để sử dụng và phù hợp nhất cho các mẫu nhỏ. Với nhiều thiết kế thử nghiệm, kích thước mẫu phải giống nhau cho các kết hợp cấp độ yếu tố khác nhau.
ANOVA là hữu ích để thử nghiệm ba hoặc nhiều biến. Nó tương tự như nhiều bài kiểm tra hai mẫu. Tuy nhiên, nó dẫn đến ít lỗi loại I hơn và phù hợp với một loạt các vấn đề. ANOVA nhóm khác biệt bằng cách so sánh các phương tiện của từng nhóm và bao gồm việc phân tán phương sai vào các nguồn khác nhau. Nó được sử dụng với các đối tượng, nhóm thử nghiệm, giữa các nhóm và trong các nhóm.
ANOVA một chiều so với ANOVA hai chiều
Có hai loại ANOVA: một chiều (hoặc một chiều) và hai chiều. Một chiều hoặc hai chiều đề cập đến số lượng biến độc lập trong phân tích kiểm tra phương sai của bạn. Một ANOVA một chiều đánh giá tác động của một yếu tố duy nhất đến một biến phản ứng duy nhất. Nó xác định xem tất cả các mẫu là như nhau. ANOVA một chiều được sử dụng để xác định xem có bất kỳ sự khác biệt có ý nghĩa thống kê nào giữa các phương tiện của ba hoặc nhiều nhóm độc lập (không liên quan) hay không.
ANOVA hai chiều là một phần mở rộng của ANOVA một chiều. Với một chiều, bạn có một biến độc lập ảnh hưởng đến biến phụ thuộc. Với ANOVA hai chiều, có hai độc lập. Ví dụ, ANOVA hai chiều cho phép một công ty so sánh năng suất của công nhân dựa trên hai biến độc lập, chẳng hạn như mức lương và bộ kỹ năng. Nó được sử dụng để quan sát sự tương tác giữa hai yếu tố và kiểm tra tác động của hai yếu tố cùng một lúc.
