Thế lưỡng nan của tù nhân là gì?
Tình thế tiến thoái lưỡng nan của tù nhân là một nghịch lý trong phân tích quyết định, trong đó hai cá nhân hành động vì lợi ích cá nhân của họ không tạo ra kết quả tối ưu. Tình huống khó xử của tù nhân điển hình được thiết lập theo cách mà cả hai bên chọn cách tự bảo vệ mình bằng chi phí của người tham gia khác. Kết quả là, cả hai người tham gia đều thấy mình ở trạng thái tồi tệ hơn so với việc họ đã hợp tác với nhau trong quá trình ra quyết định. Tình trạng khó xử của tù nhân là một trong những khái niệm nổi tiếng nhất trong lý thuyết trò chơi hiện đại.
Chìa khóa chính
- Tình trạng khó xử của tù nhân là tình huống mà những người ra quyết định cá nhân luôn có động lực để lựa chọn theo cách tạo ra kết quả không tối ưu cho các cá nhân như một nhóm. Tình huống khó xử của tù nhân xảy ra trong nhiều khía cạnh của nền kinh tế. Mọi người đã phát triển nhiều phương pháp khắc phục tình trạng khó xử của tù nhân để chọn kết quả tập thể tốt hơn mặc dù những khuyến khích cá nhân rõ ràng không thuận lợi.
Thế lưỡng nan của tù nhân
Hiểu vấn đề nan giải của tù nhân
Tình thế tiến thoái lưỡng nan của tù nhân đưa ra một tình huống trong đó hai bên, tách biệt và không thể liên lạc, mỗi bên phải lựa chọn giữa việc hợp tác với bên kia hay không. Phần thưởng cao nhất cho mỗi bên xảy ra khi cả hai bên chọn hợp tác.
Tình thế tiến thoái lưỡng nan của tù nhân cổ điển diễn ra như sau: hai thành viên của một nhóm cướp ngân hàng, Dave và Henry, đã bị bắt và đang bị thẩm vấn trong các phòng riêng biệt. Chính quyền không có nhân chứng nào khác, và chỉ có thể chứng minh vụ án chống lại họ nếu họ có thể thuyết phục ít nhất một trong số những tên cướp phản bội đồng phạm của mình và làm chứng cho tội ác. Mỗi tên cướp ngân hàng phải đối mặt với sự lựa chọn hợp tác với đồng phạm của mình và giữ im lặng hoặc đào tẩu khỏi băng đảng và làm chứng cho việc truy tố. Nếu cả hai cùng hợp tác và giữ im lặng, thì chính quyền sẽ chỉ có thể kết án họ với tội nhẹ hơn là lảng vảng, nghĩa là mỗi năm một năm tù (1 năm cho Dave + 1 năm cho Henry = 2 năm tổng số tù thời gian). Nếu một người làm chứng còn người kia thì không, thì người làm chứng sẽ được miễn phí và người kia sẽ nhận được ba năm (0 năm cho người bị lỗi + 3 cho tổng số người bị kết án = 3 năm). Tuy nhiên, nếu cả hai làm chứng chống lại người kia, mỗi người sẽ phải ngồi tù hai năm vì chịu trách nhiệm một phần cho vụ cướp (2 năm cho Dave + 2 năm cho Henry = 4 năm tổng thời gian ngồi tù).
Trong trường hợp này, mỗi tên cướp luôn có động cơ để đào tẩu, bất kể sự lựa chọn nào mà người kia đưa ra. Theo quan điểm của Dave, nếu Henry giữ im lặng, thì Dave có thể hợp tác với Henry và ngồi tù một năm, hoặc đào tẩu và tự do. Rõ ràng anh ta sẽ tốt hơn khi phản bội Henry và phần còn lại của băng đảng trong trường hợp này. Mặt khác, nếu Henry khiếm khuyết và làm chứng chống lại Dave, thì lựa chọn của Dave trở nên im lặng và làm ba năm hoặc nói chuyện và làm hai năm tù. Một lần nữa, rõ ràng, anh thích làm hai năm hơn ba.
Trong cả hai trường hợp, cho dù Henry hợp tác với Dave hay khiếm khuyết trong vụ truy tố, Dave sẽ tốt hơn nếu bản thân anh ta khiếm khuyết và làm chứng. Bây giờ, vì Henry phải đối mặt với cùng một loạt các lựa chọn, anh cũng sẽ luôn luôn tốt hơn trong việc đào thoát. Nghịch lý của tình trạng khó xử của tù nhân là: cả hai tên cướp có thể giảm thiểu tổng thời gian ngồi tù mà hai người sẽ làm nếu cả hai cùng hợp tác (tổng cộng 2 năm), nhưng những ưu đãi mà mỗi người phải đối mặt sẽ luôn khiến họ để đào tẩu và kết thúc việc thực hiện tổng thời gian ngồi tù tối đa giữa hai người họ (tổng cộng 4 năm).
Ví dụ về tình trạng tiến thoái lưỡng nan của tù nhân
Nền kinh tế được hoàn thiện với các ví dụ về tình trạng khó xử của tù nhân với các kết quả có thể có lợi hoặc có hại cho toàn bộ nền kinh tế và xã hội. Chủ đề chung là các tình huống mà các ưu đãi mà mỗi người ra quyết định cá nhân phải lựa chọn sẽ khiến họ hành xử theo cách khiến tất cả họ trở nên tồi tệ hơn, trong khi cá nhân tránh các lựa chọn sẽ giúp họ hoàn toàn tốt hơn nếu tất cả có thể một số bằng cách nào đó hợp tác lựa chọn.
Một ví dụ như vậy là bi kịch của chung. Có thể là lợi thế tập thể của mọi người để bảo tồn và tái đầu tư vào việc truyền bá tài nguyên thiên nhiên chung để có thể tiếp tục tiêu thụ nó, nhưng mỗi cá nhân luôn có một động lực để thay vào đó tiêu thụ càng nhiều càng tốt, càng tốt sau đó cạn kiệt tài nguyên. Tìm cách nào đó để hợp tác rõ ràng sẽ khiến mọi người trở nên tốt hơn ở đây.
Mặt khác, hành vi của các cartel cũng có thể được coi là một vấn đề nan giải của tù nhân. Tất cả các thành viên của cartel có thể tự làm giàu bằng cách hạn chế sản lượng để giữ giá mà mỗi người nhận được đủ cao để thu tiền thuê kinh tế từ người tiêu dùng, nhưng mỗi thành viên cartel đều có động cơ để lừa đảo cartel và tăng sản lượng để tránh tiền thuê các thành viên cartel khác. Xét về phúc lợi của toàn xã hội mà cartel hoạt động, đây là một ví dụ về cách tình trạng khó xử của tù nhân phá vỡ cartel đôi khi thực sự có thể làm cho xã hội trở nên tốt đẹp hơn.
Thoát khỏi tình trạng tiến thoái lưỡng nan của tù nhân
Theo thời gian, mọi người đã tìm ra nhiều giải pháp cho các tình huống khó xử của tù nhân để vượt qua các khuyến khích cá nhân có lợi cho lợi ích chung.
Đầu tiên, trong thế giới thực, hầu hết các tương tác kinh tế và con người khác được lặp lại nhiều lần. Tình trạng khó xử của một tù nhân thực sự thường chỉ được chơi một lần hoặc nếu không thì nó được phân loại là tiến thoái lưỡng nan của tù nhân. Trong tình thế tiến thoái lưỡng nan của tù nhân, người chơi có thể chọn các chiến lược thưởng cho sự hợp tác hoặc trừng phạt đào tẩu theo thời gian. Bằng cách liên tục tương tác với cùng một cá nhân, chúng ta thậm chí có thể cố tình chuyển từ tình trạng khó xử của tù nhân một lần sang tình trạng khó xử lặp đi lặp lại của tù nhân.
Thứ hai, mọi người đã phát triển các chiến lược thể chế chính thức để thay đổi các ưu đãi mà các nhà ra quyết định cá nhân phải đối mặt. Hành động tập thể để thực thi hành vi hợp tác thông qua danh tiếng, quy tắc, luật pháp, dân chủ hoặc ra quyết định tập thể khác và hình phạt xã hội rõ ràng đối với những vụ đào tẩu làm thay đổi nhiều tình huống khó xử của tù nhân đối với kết quả hợp tác có lợi hơn.
Cuối cùng, một số người và nhóm người đã phát triển thành kiến về tâm lý và hành vi theo thời gian như tin tưởng cao hơn vào nhau, định hướng tương lai lâu dài trong các tương tác lặp đi lặp lại và khuynh hướng đối ứng tích cực với hành vi hợp tác hoặc đối ứng tiêu cực của hành vi khiếm khuyết. Những xu hướng này có thể phát triển thông qua một loại chọn lọc tự nhiên trong một xã hội theo thời gian, hoặc lựa chọn nhóm giữa các xã hội cạnh tranh khác nhau. Trên thực tế, họ dẫn dắt các nhóm cá nhân đến với nhau một cách phi lý và chọn những kết quả thực sự có lợi nhất cho tất cả họ cùng nhau.
Kết hợp lại, ba yếu tố này (tình huống khó xử của tù nhân lặp đi lặp lại, các tổ chức chính thức phá vỡ tình trạng khó xử của tù nhân và những thành kiến hành vi làm suy yếu sự lựa chọn cá nhân của Lý trong tình huống khó xử của tù nhân) giúp giải quyết nhiều vấn đề nan giải của tù nhân mà chúng ta sẽ phải đối mặt.
