Thế lưỡng nan của Traveler là gì?
Tình thế tiến thoái lưỡng nan của khách du lịch, theo lý thuyết trò chơi, là một trò chơi có tổng bằng không, trong đó hai người chơi cố gắng tối đa hóa khoản thanh toán của riêng họ, mà không quan tâm đến người kia. Trò chơi thể hiện "nghịch lý của sự hợp lý", điều trớ trêu là việc đưa ra các quyết định một cách phi logic hoặc ngây thơ thường tạo ra một kết quả tốt hơn trong lý thuyết trò chơi.
Chìa khóa chính
- Tình huống khó xử của Traveler là một trò chơi trong đó hai người chơi mỗi người trả giá cho một khoản chi trả được đề xuất và cả hai đều nhận được giá thầu thấp hơn, cộng hoặc trừ đi phần thưởng. Theo lý thuyết trò chơi, chiến lược hợp lý cho cả hai người chơi là chọn mức chi trả thấp nhất có thể. Điều này dẫn đến việc cả hai người chơi nhận được số tiền chi trả thấp hơn mức họ có thể đạt được bằng cách tuân theo chiến lược phi lý. Trong các nghiên cứu thử nghiệm, mọi người luôn chọn mức chi trả cao hơn và đạt được kết quả tốt hơn so với chiến lược hợp lý được dự đoán bởi lý thuyết trò chơi.
Hiểu vấn đề nan giải của Traveler
Trò chơi tiến thoái lưỡng nan của người du lịch, được xây dựng vào năm 1994 bởi nhà kinh tế Kaushik Basu, đưa ra một kịch bản trong đó một hãng hàng không gây thiệt hại nghiêm trọng cho đồ cổ giống hệt nhau được mua bởi hai khách du lịch khác nhau. Người quản lý hãng hàng không sẵn sàng bồi thường cho họ vì mất đồ cổ, nhưng vì anh ta không biết gì về giá trị của họ, anh ta nói với hai du khách hãy viết riêng ước tính của họ về giá trị như bất kỳ số nào trong khoảng từ 2 đến 100 đô la mà không trao cho ai khác.
Tuy nhiên, có một vài cảnh báo:
- Nếu cả hai khách du lịch viết cùng một số, anh ta sẽ hoàn trả cho mỗi người số tiền đó. Nếu họ viết các số khác nhau, người quản lý sẽ cho rằng giá thấp hơn là giá trị thực và người có số cao hơn đang gian lận. Trong khi anh ta sẽ trả cho cả hai con số thấp hơn, người có số thấp hơn sẽ nhận được tiền thưởng 2 đô la vì sự trung thực, trong khi người viết số cao hơn sẽ bị phạt 2 đô la.
Sự lựa chọn hợp lý, về mặt cân bằng Nash, là 2 đô la. Các lý do diễn ra như sau. Sự thúc đẩy đầu tiên của khách du lịch A có thể là viết ra 100 đô la; nếu Traveller B cũng ghi giảm 100 đô la, đó là số tiền cả hai sẽ nhận được từ người quản lý hãng hàng không. Nhưng theo suy nghĩ thứ hai, Traveller A lý do rằng nếu anh ta viết 99 đô la và B giảm xuống 100 đô la, thì A sẽ nhận được 101 đô la (99 đô la + 2 đô la tiền thưởng). Nhưng A tin rằng dòng suy nghĩ này cũng sẽ xảy ra với B, và nếu B cũng giảm 99 đô la, cả hai sẽ nhận được 99 đô la. Vì vậy, A thực sự sẽ tốt hơn khi bỏ xuống $ 98 và nhận $ 100 ($ 98 + $ 2 tiền thưởng) nếu B viết $ 99. Nhưng vì cùng suy nghĩ về việc viết $ 98 có thể xảy ra với B, A đã cân nhắc việc giảm $ 97, v.v. Dòng cảm ứng ngược này sẽ đưa khách du lịch xuống con số nhỏ nhất cho phép, đó là 2 đô la.
Mọi người có thực sự chọn trạng thái cân bằng Nash không?
Trong các nghiên cứu thực nghiệm, trái với dự đoán của lý thuyết trò chơi, hầu hết mọi người chọn 100 đô la hoặc một con số gần với nó, mà không nghĩ đến vấn đề thông qua hoặc trong khi nhận thức đầy đủ rằng họ đang đi chệch khỏi sự lựa chọn hợp lý. Vì vậy, trong khi hầu hết mọi người trực giác cảm thấy rằng họ sẽ chọn một con số cao hơn nhiều so với 2 đô la, thì trực giác này dường như mâu thuẫn với kết quả logic được dự đoán bởi lý thuyết trò chơi mà mỗi khách du lịch sẽ chọn 2 đô la. Bằng cách từ chối sự lựa chọn hợp lý và hành động phi logic bằng cách viết một con số cao hơn, cuối cùng mọi người sẽ nhận được một khoản tiền lớn hơn đáng kể.
Những kết quả này đồng ý với các nghiên cứu tương tự sử dụng các trò chơi khác như Thế lưỡng nan của tù nhân và trò chơi Hàng hóa công cộng, nơi các đối tượng thử nghiệm có xu hướng không chọn trạng thái cân bằng Nash. Dựa trên những nghiên cứu này, các nhà nghiên cứu đã đề xuất rằng mọi người dường như có thái độ tự nhiên, tích cực ủng hộ hợp tác. Thái độ này dẫn đến sự cân bằng hợp tác cung cấp mức chi trả cao hơn cho tất cả người chơi trong các trò chơi bắn một lần hoặc lặp đi lặp lại, và có thể được giải thích bằng áp lực tiến hóa có chọn lọc ủng hộ các loại chiến lược có vẻ phi lý nhưng có lợi này.
Tuy nhiên, các nghiên cứu tiến thoái lưỡng nan của du khách cũng chỉ ra rằng khi hình phạt / tiền thưởng lớn hơn hoặc khi người chơi bao gồm các đội của một số người đưa ra quyết định chung, thì người chơi thường chọn theo chiến lược hợp lý dẫn đến trạng thái cân bằng Nash. Các hiệu ứng này cũng tương tác, trong đó các nhóm người chơi không chỉ chọn chiến lược hợp lý hơn mà còn phản ứng nhanh hơn với kích thước của hình phạt / tiền thưởng so với từng người chơi. Các nghiên cứu này cho thấy các chiến lược phát triển có xu hướng tạo ra kết quả xã hội có lợi có thể được bù đắp bằng các chiến lược hợp lý hơn có xu hướng cân bằng Nash tùy thuộc vào cấu trúc của các khuyến khích và sự hiện diện của các bộ phận xã hội.
