Công thức phân phối bình thường dựa trên hai tham số đơn giản - giá trị trung bình và độ lệch chuẩn - định lượng các đặc tính của một tập dữ liệu đã cho. Mặc dù giá trị trung bình biểu thị giá trị trung tâm của các điểm trung tâm hoặc giá trị trung bình của toàn bộ tập dữ liệu, độ lệch chuẩn biểu thị mức độ lan truyền của trò chơi hay biến thể của điểm dữ liệu xung quanh giá trị trung bình đó.
Hãy xem xét 2 bộ dữ liệu sau:
Bộ dữ liệu 1 = {10, 10, 10, 10, 10, 10, 10, 10, 10, 10}
Bộ dữ liệu 2 = {6, 8, 10, 12, 14, 14, 12, 10, 8, 6}
Đối với Dataset1, mean = 10 và độ lệch chuẩn (stddev) = 0
Đối với Dataset2, mean = 10 và độ lệch chuẩn (stddev) = 2, 83
Hãy vẽ các giá trị này cho Dataset1:
Tương tự như vậy đối với Dataset2:
Đường ngang màu đỏ trong cả hai biểu đồ trên biểu thị giá trị trung bình hoặc giá trị trung bình của mỗi bộ dữ liệu (10 trong cả hai trường hợp). Mũi tên màu hồng trong biểu đồ thứ hai biểu thị sự lan truyền hoặc biến đổi của các giá trị dữ liệu từ giá trị trung bình. Điều này được biểu thị bằng giá trị độ lệch chuẩn là 2, 83 trong trường hợp của Dataset2. Vì DataSet1 có tất cả các giá trị giống nhau (10 cái) và không có biến thể, nên giá trị stddev bằng 0 và do đó không áp dụng mũi tên màu hồng nào.
Giá trị stddev có một vài đặc điểm quan trọng và hữu ích, cực kỳ hữu ích trong phân tích dữ liệu. Đối với phân phối bình thường, các giá trị dữ liệu được phân phối đối xứng ở hai bên của giá trị trung bình. Đối với bất kỳ tập dữ liệu được phân phối bình thường, vẽ đồ thị với stddev trên trục hoành và không. của các giá trị dữ liệu trên trục tung, thu được biểu đồ sau.
Thuộc tính của phân phối chuẩn
- Đường cong bình thường đối xứng với giá trị trung bình; Trung bình nằm ở giữa và chia diện tích thành hai nửa; Tổng diện tích dưới đường cong bằng 1 cho mean = 0 và stdev = 1; Phân phối được mô tả hoàn toàn bởi giá trị trung bình của nó và stddev
Như có thể thấy từ biểu đồ trên, stddev thể hiện như sau:
- 68, 3% giá trị dữ liệu nằm trong phạm vi 1 độ lệch chuẩn của giá trị trung bình (-1 đến +1) 95, 4% giá trị dữ liệu nằm trong 2 độ lệch chuẩn của giá trị trung bình (-2 đến +2) 99, 7% giá trị dữ liệu nằm trong 3 độ lệch chuẩn của giá trị trung bình (-3 đến +3)
Khu vực dưới đường cong hình chuông, khi được đo, cho biết xác suất mong muốn của một phạm vi nhất định:
- nhỏ hơn X: - ví dụ: xác suất của các giá trị dữ liệu nhỏ hơn 70 lớn hơn X - ví dụ: xác suất của các giá trị dữ liệu lớn hơn 95 giữa X 1 và X 2 - ví dụ: xác suất của các giá trị dữ liệu trong khoảng từ 65 đến 85
Trong đó X là một giá trị quan tâm (ví dụ dưới đây).
Vẽ và tính toán diện tích không phải lúc nào cũng thuận tiện, vì các bộ dữ liệu khác nhau sẽ có giá trị trung bình và stddev khác nhau. Để tạo điều kiện cho một phương pháp tiêu chuẩn thống nhất để dễ dàng tính toán và áp dụng cho các vấn đề trong thế giới thực, việc chuyển đổi tiêu chuẩn thành giá trị Z đã được giới thiệu, tạo thành một phần của Bảng phân phối chuẩn.
Z = (X - trung bình) / stddev, trong đó X là biến ngẫu nhiên.
Về cơ bản, chuyển đổi này buộc giá trị trung bình và stddev phải được chuẩn hóa thành 0 và 1 tương ứng, cho phép sử dụng một bộ giá trị Z được xác định chuẩn (từ Bảng phân phối chuẩn) để dễ dàng tính toán. Ảnh chụp nhanh của bảng giá trị z tiêu chuẩn chứa các giá trị xác suất như sau:
z |
0, 00 |
0, 01 |
0, 02 |
0, 03 |
0, 04 |
0, 05 |
0, 06 |
0, 0 |
0, 00000 |
0, 00399 |
0, 00798 |
0, 01197 |
0, 01595 |
0, 01994 |
Giáo dục |
0, 1 |
0, 0398 |
0, 04380 |
0, 04776 |
0, 05172 |
0, 05567 |
0, 05966 |
Giáo dục |
0, 2 |
0, 0793 |
0, 08317 |
0, 08706 |
0, 09095 |
0, 09483 |
0, 09871 |
Giáo dục |
0, 3 |
0, 1791 |
0, 12172 |
0, 12552 |
0.12930 |
0, 13307 |
0.13683 |
Giáo dục |
0, 4 |
0.15542 |
0.15910 |
0, 16276 |
0.16640 |
0.17003 |
0, 17364 |
Giáo dục |
0, 5 |
0.19146 |
0, 19497 |
0.19847 |
0, 20194 |
0, 20540 |
0, 20884 |
Giáo dục |
0, 6 |
0, 22575 |
0, 22907 |
0, 23237 |
0, 23565 |
0, 23891 |
0, 24215 |
Giáo dục |
0, 7 |
0, 25804 |
0, 26115 |
0, 26424 |
0.26730 |
0, 27035 |
0, 2737 |
Giáo dục |
Giáo dục |
Giáo dục |
Giáo dục |
Giáo dục |
Giáo dục |
Giáo dục |
Giáo dục |
Giáo dục |
Để tìm xác suất liên quan đến giá trị z là 0, 239865, trước tiên hãy làm tròn đến 2 chữ số thập phân (tức là 0, 24). Sau đó kiểm tra 2 chữ số có nghĩa đầu tiên (0, 2) trong các hàng và cho chữ số có nghĩa nhỏ nhất (0, 04 còn lại) trong cột. Điều đó sẽ dẫn đến giá trị 0, 09483.
Bảng phân phối bình thường đầy đủ, với độ chính xác lên đến 5 điểm thập phân cho các giá trị xác suất (bao gồm cả các giá trị âm), có thể được tìm thấy ở đây.
Chúng ta hãy xem một số ví dụ thực tế cuộc sống. Chiều cao của các cá nhân trong một nhóm lớn tuân theo mô hình phân phối bình thường. Giả sử rằng chúng ta có một bộ gồm 100 cá nhân có chiều cao được ghi lại và giá trị trung bình và stddev được tính tương ứng là 66 và 6 inch.
Dưới đây là một vài câu hỏi mẫu có thể dễ dàng trả lời bằng bảng giá trị z:
- Xác suất mà một người trong nhóm là 70 inch trở xuống là gì?
Câu hỏi là tìm giá trị tích lũy của P (X <= 70) tức là trong toàn bộ tập dữ liệu của 100, có bao nhiêu giá trị sẽ nằm trong khoảng từ 0 đến 70.
Trước tiên, hãy chuyển đổi giá trị X của 70 thành giá trị Z tương đương.
Z = (X - trung bình) / stddev = (70-66) / 6 = 4/6 = 0.66667 = 0.67 (làm tròn đến 2 chữ số thập phân)
Bây giờ chúng ta cần tìm P (Z <= 0, 67) = 0. 24857 (từ bảng z ở trên)
tức là có xác suất 24, 857% rằng một cá nhân trong nhóm sẽ nhỏ hơn hoặc bằng 70 inch.
Nhưng chờ đợi - ở trên là không đầy đủ. Hãy nhớ rằng, chúng tôi đang tìm kiếm xác suất của tất cả các độ cao có thể lên tới 70 tức là từ 0 đến 70. Ở trên chỉ cung cấp cho bạn phần từ giá trị trung bình đến giá trị mong muốn (tức là 66 đến 70). Chúng ta cần bao gồm nửa kia - từ 0 đến 66 - để đi đến câu trả lời đúng.
Vì 0 đến 66 đại diện cho một nửa phần (nghĩa là một cực trị trung bình trung bình), xác suất của nó chỉ đơn giản là 0, 5.
Do đó xác suất chính xác của một người từ 70 inch trở xuống = 0, 24857 + 0, 5 = 0. 74857 = 74.857%
Về mặt đồ họa (bằng cách tính diện tích), đây là hai vùng tổng thể đại diện cho giải pháp:
- Xác suất mà một người là 75 inch trở lên là gì?
tức là Tìm P tích lũy bổ sung (X> = 75).
Z = (X - trung bình) / stddev = (75-66) / 6 = 9/6 = 1.5
P (Z> = 1, 5) = 1- P (Z <= 1, 5) = 1 - (0, 5 + 0, 43319) = 0, 06681 = 6, 681%
- Xác suất của một người ở giữa 52 inch và 67 inch là gì?
Tìm P (52 <= X <= 67).
P (52 <= X <= 67) = P = P (-2, 33 <= Z <= 0, 17)
= P (Z <= 0.17) CẦU (Z <= -0.233) = (0.5 + 0.56749) - (.40905) =
Bảng phân phối bình thường này (và giá trị z) thường được sử dụng cho mọi tính toán xác suất đối với các biến động giá dự kiến trong thị trường chứng khoán cho các cổ phiếu và chỉ số. Chúng được sử dụng trong giao dịch dựa trên phạm vi, xác định xu hướng tăng hoặc xu hướng giảm, mức hỗ trợ hoặc kháng cự và các chỉ báo kỹ thuật khác dựa trên các khái niệm phân phối bình thường về độ lệch trung bình và độ lệch chuẩn.
So sánh các tài khoản đầu tư × Các ưu đãi xuất hiện trong bảng này là từ các mối quan hệ đối tác mà Investopedia nhận được bồi thường. Tên nhà cung cấp Mô tảNhững bài viết liên quan
Giáo dục cơ bản
Kiểm định giả thuyết trong tài chính: Khái niệm và ví dụ
Quản lý rủi ro
Tối ưu hóa danh mục đầu tư của bạn bằng cách sử dụng phân phối bình thường
Phân tích kỹ thuật Giáo dục cơ bản
Hồi quy tuyến tính của thời gian và giá cả
Quản lý rủi ro
Công dụng và giới hạn của biến động
Phân tích tài chính
Cách tính giá trị rủi ro (VaR) trong Excel
Công cụ phân tích cơ bản
Hiểu các phép đo biến động
Liên kết đối tácĐiều khoản liên quan
Định nghĩa khoảng tin cậy Khoảng tin cậy, trong thống kê, đề cập đến xác suất tham số dân số sẽ nằm giữa hai giá trị được đặt. Quản lý rủi ro nhiều hơn trong tài chính Trong thế giới tài chính, quản lý rủi ro là quá trình xác định, phân tích và chấp nhận hoặc giảm thiểu sự không chắc chắn trong các quyết định đầu tư. Quản lý rủi ro xảy ra bất cứ lúc nào một nhà đầu tư hoặc nhà quản lý quỹ phân tích và cố gắng định lượng khả năng thua lỗ trong một khoản đầu tư. hiểu thêm về đường cong kho bạc tỷ giá giao ngay Đường cong kho bạc lãi suất giao ngay được định nghĩa là đường cong lợi suất được xây dựng bằng tỷ giá giao ngay của Kho bạc thay vì lãi suất. Đường cong Kho bạc lãi suất giao ngay có thể được sử dụng làm chuẩn mực cho trái phiếu định giá. thêm Định nghĩa chỉ số Gini Chỉ số Gini là thước đo phân phối thống kê thường được sử dụng làm thước đo bất bình đẳng kinh tế. nhiều mô hình định giá tài sản vốn (CAPM) Mô hình định giá tài sản vốn là một mô hình mô tả mối quan hệ giữa rủi ro và lợi nhuận kỳ vọng. hiểu thêm về ý nghĩa điều hòa Trung bình hài là trung bình được sử dụng trong tài chính cho bội số trung bình như tỷ lệ thu nhập giá. hơn