Cân bằng Nash là gì?
Cân bằng Nash là một khái niệm trong lý thuyết trò chơi trong đó kết quả tối ưu của trò chơi là không có động cơ để đi chệch khỏi chiến lược ban đầu của họ. Cụ thể hơn, điểm cân bằng Nash là một khái niệm về lý thuyết trò chơi trong đó kết quả tối ưu của trò chơi là điều mà không người chơi nào có động cơ để đi chệch khỏi chiến lược đã chọn của mình sau khi xem xét lựa chọn của đối thủ.
Nhìn chung, một cá nhân có thể không nhận được lợi ích gia tăng từ việc thay đổi hành động, giả sử những người chơi khác không đổi trong chiến lược của họ. Một trò chơi có thể có nhiều điểm cân bằng Nash hoặc không có gì cả.
Điểm cân bằng Nash
Hiểu về trạng thái cân bằng Nash
Cân bằng Nash được đặt theo tên của nhà phát minh của nó, John Nash, một nhà toán học người Mỹ. Nó được coi là một trong những khái niệm quan trọng nhất của lý thuyết trò chơi, trong đó cố gắng xác định về mặt toán học và logic các hành động mà người tham gia trò chơi nên thực hiện để đảm bảo kết quả tốt nhất cho chính họ. Lý do tại sao cân bằng Nash được coi là một khái niệm quan trọng của lý thuyết trò chơi liên quan đến khả năng ứng dụng của nó. Cân bằng Nash có thể được kết hợp vào một loạt các ngành, từ kinh tế đến khoa học xã hội.
Chìa khóa chính
- Cân bằng Nash là một định lý đưa ra quyết định trong lý thuyết trò chơi nói rằng người chơi có thể đạt được kết quả mong muốn bằng cách không đi lệch khỏi chiến lược ban đầu của họ. Trong trạng thái cân bằng Nash, mỗi chiến lược của người chơi là tối ưu khi xem xét quyết định của người chơi khác. Mọi người chơi đều thắng vì mọi người đều nhận được kết quả mà họ mong muốn. Tình huống khó xử của tù nhân là một ví dụ lý thuyết trò chơi phổ biến và là một ví dụ thể hiện đầy đủ hiệu quả của Cân bằng Nash.
Để nhanh chóng tìm thấy trạng thái cân bằng Nash hoặc xem liệu nó có tồn tại hay không, hãy tiết lộ chiến lược của từng người chơi cho những người chơi khác. Nếu không ai thay đổi chiến lược của mình, thì trạng thái cân bằng Nash được chứng minh.
Ví dụ thực tế về trạng thái cân bằng Nash
Hãy tưởng tượng một trò chơi giữa Tom và Sam. Trong trò chơi đơn giản này, cả hai người chơi có thể chọn chiến lược A, để nhận $ 1 hoặc chiến lược B, để mất $ 1. Theo logic, cả hai người chơi chọn chiến lược A và nhận được số tiền thưởng là 1 đô la. Nếu bạn tiết lộ chiến lược của Sam cho Tom và ngược lại, bạn sẽ thấy rằng không có người chơi nào đi chệch khỏi lựa chọn ban đầu. Biết di chuyển của người chơi khác có nghĩa là ít và không thay đổi hành vi của người chơi. Kết quả A đại diện cho trạng thái cân bằng Nash.
Cân nhắc đặc biệt: Thế lưỡng nan của tù nhân
Tình trạng khó xử của tù nhân là một tình huống phổ biến được phân tích trong lý thuyết trò chơi có thể sử dụng trạng thái cân bằng Nash. Trong trò chơi này, hai tên tội phạm bị bắt giữ và mỗi tên bị giam giữ đơn độc mà không có phương tiện liên lạc với người kia. Các công tố viên không có bằng chứng để kết tội cặp đôi, vì vậy họ cung cấp cho mỗi tù nhân cơ hội để phản bội người kia bằng cách làm chứng rằng người kia đã phạm tội hoặc hợp tác bằng cách giữ im lặng.
Nếu cả hai tù nhân phản bội lẫn nhau, mỗi người phải ngồi tù năm năm. Nếu A phản bội B nhưng B vẫn im lặng, tù nhân A được thả tự do và tù nhân B thụ án 10 năm tù hoặc ngược lại. Nếu mỗi người im lặng, thì mỗi người chỉ phải ngồi tù một năm. Điểm cân bằng Nash trong ví dụ này là để cả hai người chơi phản bội lẫn nhau. Mặc dù sự hợp tác lẫn nhau dẫn đến một kết quả tốt hơn nếu một tù nhân chọn hợp tác lẫn nhau và người kia thì không, kết quả của một tù nhân còn tồi tệ hơn.
