ทฤษฎีเกม: ความรู้ฉบับพกพา • พรเทพ เบญญาอภิกุล แปล จากเรื่อง Ga m e T he o r y : A V e r y S h or t I n t r o duc t i o n โดย Ken Binmore พิมพ์ครั้งแรก: ส�ำนักพิมพ์ o p e n w o r l d s , มีนาคม 2558 ราคา 285 บาท คณะบรรณาธิการอ�ำนวยการ ภิญโญ ไตรสุริยธรรมา สฤณี อาชวานันทกุล แอลสิทธิ์ เวอร์การา กรมัยพล สิริมงคลรุจิกุล พลอยแสง เอกญาติ วรพจน์ วงศ์กิจรุ่งเรือง ปกป้อง จันวิทย์ กฤดิกร เผดิมเกื้อกูลพงศ์ บรรณาธิการบริหาร วรพจน์ วงศ์กิจรุ่งเรือง กรมัยพล สิริมงคลรุจิกุล เลขานุการกองบรรณาธิการ ภรณ์ทิพย์ ปิยฤทธิพงศ์ บรรณาธิการส�ำนักพิมพ์ วิรพา อังกูรทัศนียรัตน์ ภูมิ นํ้าวล ฐณฐ จินดานนท์ บุญชัย แซ่เงี้ยว บรรณาธิการศิลปกรรม กรมัยพล สิริมงคลรุจิกุล • บรรณาธิการเล่ม ฐณฐ จินดานนท์ บรรณาธิการต้นฉบับ บุญชัย แซ่เงี้ยว ภูมิ น�้ำวล ออกแบบปก w r o ngd e s i g n • จัดท�ำโดย บริษัท โอเพ่นเวิลด์ส พับลิชชิ่ง เฮาส์ จ�ำกัด 604/157 ถนนสาธุประดิษฐ์ แขวงบางโพงพาง เขตยานนาวา กรุงเทพฯ 10120 โทรศัพท์ 0 2 - 6 1 8 - 4 7 3 0 e m a il: o p e n w o r l d s t h a i l a n d @g m a i l . c o m fa c e b o o k : w w w . f a c e b o o k . c o m / o p e n w o r l d s twitte r : w w w . t w i t t e r . c o m / o p e n w o r l d s _ t h we b s i t e : w w w . o p e n w o r l d s . i n . t h จัดจ�ำหน่าย บริษัท ซีเอ็ดยูเคชั่น จ�ำกัด (มหาชน) เลขที่ 1858/87-90 ถนนบางนา-ตราด แขวงบางนา เขตบางนา กรุงเทพฯ 10260 โทรศัพท์ 0 - 2 7 3 9 - 8 0 0 0 โทรสาร 0 - 2 7 5 1 - 5 9 9 9 we b s i t e : h t t p : / / w w w . s e - e d . c o m /
สำ�หรับสถาบันการศึกษา องค์กร หรือบุคคล ที่ต้องการสั่งซื้อหนังสือ จำ�นวนมากในราคาลดพิเศษ โปรดติดต่อ กรมัยพล สิริมงคลรุจิกุล หมายเลขโทรศัพท์ 086 403 6451 หรือ Email: openworldsthailand@gmail.com
ข้อมูลทางบรรณานุกรมของสำ�นักหอสมุดแห่งชาติ บินมอร์, เคน. ทฤษฎีเกม: ความรู้ฉบับพกพา.-- กรุงเทพฯ : โอเพ่นเวิลด์ส, 2558. 296 หน้า. 1. เศรษฐศาสตร์. I. พรเทพ เบญญาอภิกุล, ผู้เแปล. II. ชื่อเรื่อง. 330 ISBN 978-616-7885-15-5 • Thai language translation copyright 2015 by openworlds publishing house /Copyright © 2007 by Ken Binmore All Rights Reserved. Gam e T h e o ry : A Ve ry S h o r t I n t r o d u c t i o n , b y K e n B i n m o r e was or iginally publis h e d in En g lis h in 2 0 0 7 . This translation is published by arrangement with Oxford University Press t hrou g h T u ttle -M o ri Ag e n c y C o . , L t d . The T h a i e d itio n is tra n s l a t e d b y P o r n t h e p B e n y a - a p i k u l a nd published by op e n wo rld s p u b lis h i n g h o u s e , 2 0 1 5 . ทฤษฎีเกม: ความรู้ฉบับพกพา ตีพิมพ์เป็นภาษาอังกฤษ เมื่อปี ค.ศ. 2007 แปลและตีพิมพ์เป็นภาษาไทยโดยข้อตกลงกับสำ�นักพิมพ์มหาวิทยาลัยออกซฟอร์ด
สารบัญ
. ค�ำน�ำผู้แปล : 8 1. ชื่อของเกม : 16 2. โอกาส : 48 3. เวลา : 72 4. แบบแผน : 104 5. ความสัมพันธ์ต่างตอบแทน : 126 6. ข้อมูล : 152 7. การประมูล : 174 8. ชีววิทยาเชิงวิวัฒนาการ : 198 9. การต่อรองและแนวร่วม : 234 10. ปริศนาและความย้อนแย้ง : 262 อ้างอิงและอ่านเพิ่มเติม : 288 ประวัติผู้เขียน : 294 ประวัติผู้แปล : 295
สารบัญภาพประกอบ
. 1 เกมจับคู่หัวก้อย 22 2 ตารางผลตอบแทน 23 3 ผลตอบแทนที่เป็นตัวเลข 32 4 เกมที่มีแรงจูงใจผสม 33 5 เจมส์ ดีน © 2004 TopFoto 34 6 จอห์น แนช © Robert P. Matthews/Princeton University/Getty Images 35 7 เกมทางแพร่งของนักโทษ 2 รูปแบบ 42 8 การทอดลูกเต๋า © iStockphoto 52 9 เรียนรู้ที่จะเล่นในดุลยภาพ 58 10 สองเกมกระดาน 77 11 เกมลักพาตัว 85 12 เกมลักพาตัวแสนอบอุ่น 88 13 เกมยื่นค�ำขาดฉบับย่อ 92 14 การปรับตัวเชิงวิวัฒนาการในเกมยื่นค�ำขาดฉบับย่อ 94 15 ความย้อนแย้งของร้านสาขาอย่างง่าย 99 16 เดวิด ฮูม © Hulton Archive/Getty Images 111 17 เกมหมากเล่นล�ำพังของเชลลิง 114 18 เกมล่ากวางหนุ่ม 122 19 ลิงชิมแปนซีผลัดกันดูแลท�ำความสะอาดร่างกาย © Peter Arnold Inc./ Alamy 129
20 ทฤษฎีบทพื้นบ้าน 136 21 เซตข้อมูลส�ำหรับเกมจับคู่หัวก้อย 154 22 ฟูลเฮาส์ © iStockphoto 156 23 การเล่นตามหลักแม็กซิมนิ ในแบบจ�ำลองโป๊กเกอร์ของฟอน นอยมันน์ 158 24 แบบจ�ำลองของฟอน นอยมันน์ 160 25 ตารางผลตอบแทนส�ำหรับแบบจ�ำลองโป๊กเกอร์ของฟอน นอยมันน์ 161 26 ข้อมูลไม่ครบถ้วนในเกมไก่อ่อน 165 27 ค�ำพิพากษาของโซโลมอน 180 28 ให้มากกว่านี้ไหม, ให้มากกว่านี้ไหม, ขาย! © Hiu Yin Leung/Fotolia 184 29 พลวัตหน่วยคัดส�ำเนาในเกมเหยี่ยว-พิราบ 213 30 ญาติเล่นเกมทางแพร่งของนักโทษกัน 220 31 ค้างคาวดูดเลือด © Michael and Patricia Fogden/Corbis 227 32 เกมเหยี่ยว-พิราบ-จอมแก้แค้น 229 33 ผลลัพธ์การต่อรองแนช 241 34 เหตุผลวิบัติอุปนิสัยแจ่มแจ้ง 271 35 ความพยายาม 2 แบบเพื่อเติมเต็มข้อก�ำหนดของนิวคอมบ์ 273 36 สามสุภาพสตรีแห่งมิดเวสต์ Library of Congress, Prints and Photographs Division, FSA-OW1 Collection (reproduction no. LC-USF33-012381-M5 DLC) 278 37 เกมมอนตี ฮอลล์ 285
8
Game
Theory
ค�ำน�ำผู้แปล
. อะไรคือเกม? เมื่อนึกถึง “เกม” สิ่งที่ปรากฏในความคิด ของเราอาจแตกต่างกันไป แต่ไม่วา่ จะนึกถึงสิง่ ใด เกมทุกเกมล้วน มีลักษณะพื้นฐานร่วมกันอยู่ นั่นคือ เกมประกอบด้วยผู้เล่นซึ่ง แต่ละคนเลือกใช้กลยุทธ์อย่างมีเหตุมผี ล ภายใต้สภาพการณ์หรือ “กฎ” บางอย่างเพื่อให้ได้ชัยชนะหรือผลลัพธ์ใดๆ ที่ตนต้องการ และเมื่อมองย้อนกลับมาที่เหตุการณ์ในชีวิตประจ�ำวัน เราจะพบ ว่าส่วนมากก็มีลักษณะพื้นฐานที่ว่านี้ ไม่ว่าจะเป็นการคบหาดูใจ ของหนุม่ สาว การขับรถสวนกันในซอยแคบ การตัดสินใจตัง้ ราคา สินค้าทีม่ คี แู่ ข่ง การประมูลจัดสรรคลืน่ ความถีข่ องรัฐ การก�ำหนด นโยบายอัตราดอกเบี้ยของธนาคารกลาง การที่ประเทศต่างๆ ต้องร่วมมือกันลดการปล่อยก๊าซเรือนกระจก หรือกระทั่งการ ตัดสินใจรบราฆ่าฟันกันตลอดเส้นทางอารยธรรมของมนุษยชาติ กล่าวอย่างถึงที่สุด เกมเกิดขึ้นทุกที่ทุกเวลาเมื่อผู้คน หรือสถาบันต่างๆ ปฏิสัมพันธ์กัน ไม่ว่าความสัมพันธ์ที่ว่าจะอยู่ ในลักษณะของความร่วมมือหรือความขัดแย้ง การจัดการความ สัมพันธ์เหล่านีจ้ ะว่าไปก็ถอื เป็นใจกลางชีวติ ทางสังคมของมนุษย์ ด้วยเหตุนี้ความพยายามที่จะเข้าใจมูลเหตุพื้นฐานของความ ร่วมมือและความขัดแย้งจึงเป็นหนึ่งในเป้าหมายสูงสุดส�ำหรับ สังคมศาสตร์หลายแขนง
A
Very Short Introduction
9
ทฤษฎีเกมที่ได้รับการพัฒนาขึ้นในช่วงกลางศตวรรษ ที่ 20 น�ำมาซึ่งความรู้ความเข้าใจส�ำคัญในประเด็นดังกล่าว ภายใต้ข้อสมมติว่าผู้เล่นเห็นแก่ประโยชน์ส่วนตนและตัดสินใจ อย่ า งมี เ หตุ มี ผ ล ทฤษฎี เ กมเป็ น เครื่ อ งมื อ ทรงพลั ง ในการ วิเคราะห์สถานการณ์ที่ผู้เล่นมีปฏิสัมพันธ์เชิงกลยุทธ์ต่อกัน พูดอีกอย่างหนึ่งคือ ทฤษฎีเกมจะช่วยเราหาค�ำตอบว่า ผู้เล่น แต่ ล ะรายจะมี พ ฤติ ก รรมอย่ า งไร? พฤติ ก รรมของผู ้ เ ล่ น จะ เปลี่ยนแปลงอย่างไรถ้าพฤติกรรมของอีกฝ่ายเปลี่ยนแปลงไป? สิ่งที่ผู้เล่นรู้หรือไม่รู้เกี่ยวกับฝ่ายตรงข้ามส่งผลต่อพฤติกรรม อย่างไร? อะไรคือผลลัพธ์ที่เราคาดการณ์ว่าจะเกิดขึ้น? ด้วย เพราะเป็นเครื่องมือที่มีแนวทางการวิเคราะห์ที่เป็นระบบ มี ความแน่นหนารัดกุมทางคณิตศาสตร์ แต่ก็ยังยืดหยุ่นพอที่จะ น�ำไปประยุกต์กับสถานการณ์ที่แตกต่างหลากหลาย ทฤษฎีเกม จึงมีสว่ นปฏิวตั แิ นวทางการวิจยั ในหลายสาขาวิชาทีม่ นั ได้สมั ผัส ตั้งแต่เศรษฐศาสตร์ไปจนถึงรัฐศาสตร์ นิติศาสตร์ จิตวิทยา หรือ กระทั่งปรัชญาและชีววิทยา ทฤษฎีเกม: ความรู้ฉบับพกพา เล่มนี้น�ำเราเข้าสู่โลก ที่น่าตื่นตาตื่นใจของทฤษฎีเกม เคน บินมอร์ ผู้เขียนซึ่งเป็น นักทฤษฎีเกมชั้นแนวหน้า ใช้เนื้อหาในช่วงต้นอธิบายหลักการ พื้นฐานทางเทคนิคที่ส�ำคัญของทฤษฎีเกม ผ่านตัวอย่างที่เป็น เกมแบบง่ายๆ โดยหลีกเลี่ยงการใช้สมการคณิตศาสตร์ ซึ่งเขา ก็ถ่ายทอดความเข้าใจได้อย่างลึกซึ้งและชัดเจน แม้อาจซับซ้อน บ้างในบางส่วนแต่หากครุ่นคิดตามก็จะเข้าใจสารที่สื่อได้ไม่ยาก ตลอดทัง้ เล่ม บินมอร์ยงั สอดแทรกเกร็ดความรูน้ า่ สนใจ
10
Game
Theory
เกีย่ วกับแนวคิดและชีวประวัตขิ องผูค้ นทีโ่ ยงใยกับพัฒนาการของ ทฤษฎีเกม ทัง้ ยังได้แสดงความคิดเห็นกระทัง่ วิพากษ์แนวคิดของ บุคคลเหล่านั้นอย่างตรงไปตรงมาไม่อ้อมค้อม ซึ่งไม่เพียงสร้าง อรรถรสในการอ่านแต่ยังทิ้งประเด็นต่างๆ ทั้งทางเศรษฐศาสตร์ ปรัชญา และอื่นๆ ให้ผู้อ่านได้เก็บไปคิดใคร่ครวญต่อตามความ สนใจ ในความเห็นของผู้แปล หนังสือเล่มนี้มีความเป็นเลิศ ในแง่ที่บินมอร์อุทิศเนื้อหาส่วนใหญ่เพื่ออธิบายการประยุกต์ใช้ ทฤษฎีเกมในโลกแห่งความจริง เมื่อพินิจจากตัวอย่างประกอบ ผู้อ่านอาจต้องประหลาดใจที่พบว่านอกจากจะมีการประยุกต์ใช้ เพื่อออกแบบการประมูลแล้ว ทฤษฎีเกมสามารถอธิบายการ เกิ ด ขึ้ น ของบรรทั ด ฐานทางสั ง คม กระบวนการวิ วั ฒ นาการ หรือกระทั่งเผยความลับแห่งการร่วมมือของมนุษยชาติ ผู้แปลขอขอบคุณส�ำนักพิมพ์และทีมงาน openworlds โดยเฉพาะอย่างยิง่ อ. ปกป้อง จันวิทย์ และ อ. วรพจน์ วงศ์กจิ รุง่ เรือง ที่เชิญชวนและไว้วางใจให้แปลหนังสือเล่มนี้ ฐณฐ จินดานนท์, บุญชัย แซ่เงี้ยว และ ภูมิ น�้ำวล ที่ช่วยตรวจแก้ต้นฉบับได้อย่าง ยอดเยีย่ ม ความผิดพลาดใดทีเ่ กิดขึน้ ถือเป็นความรับผิดชอบของ ผู้แปลแต่เพียงผู้เดียว
พรเทพ เบญญาอภิกุล มีนาคม 2558
แด่ ปีเตอร์และนีนา
ทฤษฎีเกม •
ความรู้ฉบับพกพา
GAME THEORY • A
Very
Short
Introduction
by
Ke n B i n m o r e
แปลโดย
พรเทพ เบญญาอภิกุล
บทที่ 1
/ ชื่อของเกม
A
Very Short Introduction
17
ทฤษฎีเกมเกี่ยวกับอะไร? เมื่อครั้งที่ภรรยาของผมไม่อยู่ในวันที่ต้องเข้าร่วมการ ประชุมเล็กๆ น่ารืน่ รมย์ในทัสคานี หญิงสาวเยาว์วยั 3 คนเชิญผม ให้มาร่วมโต๊ะอาหารกลางวัน หลังจากผมนัง่ ลง หนึง่ ในนัน้ พูดกับ ผมด้วยน�้ำเสียงวาบหวามว่า “สอนพวกเราเล่นเกมรักหน่อยน่า” แต่กลายเป็นว่าทัง้ หมดทีพ่ วกเธอต้องการจากผมก็แค่คำ� แนะน�ำ วิธีจัดการกับแฟนหนุ่มชาวอิตาลี ผมยังคงคิดว่าพวกเธอพลาด ที่ปฏิเสธค�ำแนะน�ำเชิงกลยุทธ์ของผม แต่พวกเธอถูกต้องที่สุดที่ เข้าใจได้เองว่าการคบหาดูใจนั้นเป็นหนึ่งในเกมหลายประเภทที่ พวกเราเล่นกันในชีวิตจริง ผู้ที่ขับรถหลบหลีกกันในช่วงการจราจรหนาแน่นก�ำลัง เล่นเกมขับขี่ นักช็อปของถูกประมูลสินค้าในอีเบย์ก�ำลังเล่น เกมการประมูล บริษัทและสหภาพแรงงานที่เจรจาค่าจ้างของ ปีหน้ากันอยู่นั้นก�ำลังเล่นเกมการต่อรอง เมื่อผู้สมัครรับเลือกตั้ง เลือกน�ำเสนอนโยบายที่จะใช้แข่งขันกัน พวกเขาก็ก�ำลังเล่นเกม การเมือง เจ้าของร้านช�ำที่ก�ำลังตัดสินใจตั้งราคาคอร์นเฟลกส์
18
Game
Theory
ที่จะขายในวันนี้ก�ำลังเล่นเกมเศรษฐศาสตร์ กล่าวโดยย่อแล้ว ทุกครั้งที่มนุษย์มีปฏิสัมพันธ์กัน จะเกิดการเล่นเกมขึ้นเสมอ แอนโทนี (Mark Antony) และคลีโอพัตรา (Cleopatra) เล่นเกมเกี้ยวพาราสีกันใหญ่โตมโหระทึก บิล เกตส์ (Bill Gates) สร้างความร�่ำรวยมหาศาลให้ตนเองด้วยการเล่นเกมซอฟต์แวร์ คอมพิวเตอร์ อดอล์ฟ ฮิตเลอร์ (Adolf Hitler) และ โจเซฟ สตาลิน (Joseph Stalin) เล่นเกมซึ่งสังหารประชากรโลกไปในสัดส่วน ไม่น้อย ครุสชอฟ (Nikita Khrushchev) และเคนเนดี (John F. Kennedy) เล่นเกมกันในช่วงวิกฤตขีปนาวุธคิวบาที่เกือบจะลบ พวกเราทั้งหลายให้สิ้นไปโดยทั่วกัน ด้ ว ยสามารถน� ำ ไปประยุ ก ต์ ใ ช้ ไ ด้ ใ นหลากหลาย สาขา ทฤษฎีเกมก็น่าจะเป็นยาครอบจักรวาลของทุกปัญหา หากมั น พยากรณ์ ไ ด้ เ สมอว่ า ผู ้ ค นจะเล่ น เกมมากมายที่ เ ป็ น ส่วนประกอบหลักของชีวิตทางสังคมอย่างไร ทว่าทฤษฎีเกม นั้นไม่สามารถแก้ทุกปัญหาของโลกใบนี้ได้ เพราะมันจะใช้งาน ได้ดีต่อเมื่อผู้คนเล่นเกม อย่างมีเหตุมีผล (rationally) เท่านั้น ฉะนั้ น มั น จึ ง ไม่ อ าจพยากรณ์ พ ฤติ ก รรมของวั ย รุ ่ น ช�้ ำ รั ก อย่างโรเมโอหรือจูเลียต หรือคนบ้าดีเดือดอย่างฮิตเลอร์หรือ สตาลินได้ อย่างไรก็ตาม คนทั่วไปไม่ได้ประพฤติตนไร้เหตุ ไร้ผล (irrational) ตลอดเวลา ดังนั้นคงไม่เปล่าประโยชน์นัก ในการศึ ก ษาว่ า จะเกิ ด อะไรขึ้ น เมื่ อ ผู ้ ค นคิ ด ให้ ร อบคอบก่ อ น ตัดสินใจ อย่างน้อยพวกเราส่วนใหญ่ก็พยายามใช้เงินให้เข้าท่า และเราก็ ไ ม่ ไ ด้ ท� ำ อะไรแย่ ๆ บ่ อ ยนั ก เพราะไม่ อ ย่ า งนั้ น ทฤษฎีเศรษฐศาสตร์คงจะใช้งานไม่ได้เลย กระทั่งตอนที่ผู้คน
A
Very Short Introduction
19
ไม่ได้คิดวางแผนทุกอย่างไว้ล่วงหน้าก็ไม่จ�ำเป็นว่าพวกเขาจะ ประพฤติตนไร้เหตุไร้ผล ทฤษฎีเกมประสบความส�ำเร็จในการ อธิบายพฤติกรรมของแมงมุมและปลาจนเป็นทีเ่ ลือ่ งลือ ซึง่ ไม่อาจ กล่าวได้เลยว่าสัตว์พวกนี้มีความสามารถในการคิด แต่ที่สัตว์ เบาปัญญาเหล่านีป้ ฏิบตั ติ วั ราวกับว่าคิดอย่างมีเหตุมผี ลก็เพราะ สายพั น ธุ ์ คู ่ แ ข่ ง ของพวกมั นที่ มี ยี นซึ่ ง ก� ำ หนดให้ ป ระพฤติ ตั ว ไร้เหตุไร้ผลสูญพันธ์ุไปเรียบร้อยแล้ว ในท�ำนองเดียวกัน แม้ว่า บริษัทต่างๆ จะไม่ได้บริหารโดยผู้ฉลาดปราดเปรื่องเสมอไป แต่ ตลาดก็มักจะไร้ความปรานีพอๆ กันกับที่ธรรมชาติก�ำจัดผู้ที่ไม่ เหมาะสมให้สิ้น ทฤษฎีเกมใช้งานได้จริงหรือ? ทั้งที่มีความส�ำเร็จทางทฤษฎีอยู่มาก นักปฏิบัติในภาค ธุรกิจกลับเคยมองข้ามทฤษฎีเกมในฐานะที่เป็นเพียงอีกสาขา ของสังคมศาสตร์ที่ไร้ประโยชน์ไม่อาจใช้งานได้จริง แต่พวกเขา ก็ต้องเปลี่ยนความคิดเพียงชั่วข้ามคืนหลังจากรัฐบาลอเมริกัน ตัดสินใจประมูลขายสิทธิในการใช้คลื่นวิทยุหลายช่วงความถี่ ส�ำหรับใช้งานกับโทรศัพท์มือถือ เนื่องจากไม่มีผู้เชี่ยวชาญที่มีชื่อเสียงในเรื่องดังกล่าว ค�ำแนะน�ำของนักทฤษฎีเกมพิสูจน์ชัดว่ามีบทบาทชี้ขาดในการ ออกแบบกฎเกณฑ์ที่ใช้กับเกมการประมูล ผลลัพธ์ที่ได้ก็คือ ประชาชนชาวอเมริกนั ผูเ้ สียภาษีทำ� ก�ำไรได้ 2 หมืน่ ล้านดอลลาร์ หรือกว่า 2 เท่าของค่าคาดการณ์ตามแบบดั้งเดิม การประมูล
20
Game
Theory
ในกิ จ การโทรคมนาคมของอั ง กฤษภายหลั ง จากนั้ น ซึ่ ง ผม เป็ น ผู ้ รั บ ผิ ด ชอบ ท� ำ ก� ำ ไรได้ ม ากกว่ า นั้ น เสี ย อี ก เราท� ำ เงิ น ได้ ถึ ง 35,000 ล้ า นดอลลาร์ ใ นการประมู ล เพี ย งครั้ ง เดี ย ว ผลพวงในครานั้นคือนิตยสาร Newsweek กล่าวถึงผมว่าเป็น นักเศรษฐศาสตร์เซียนไพ่โป๊กเกอร์ใจโหดผู้ท�ำลายอุตสาหกรรม โทรคมนาคม! ครั้นเปิดไพ่กันจนหมดแล้ว อุตสาหกรรมโทรคมนาคม ก็ไม่ได้ถูกท�ำลาย และมันก็ไม่ได้โหดร้ายอะไรเลยที่จะให้บริษัท เสื อ นอนกิ น ทั้ ง หลายในอุ ต สาหกรรมโทรคมนาคมจ่ า ยค่ า ใบอนุญาตเท่าใดก็ได้ตามทีพ่ วกเขาเห็นว่าคุม้ โดยเฉพาะอย่างยิง่ เมื่อเงินเหล่านั้นถูกใช้ไปกับโรงพยาบาลส�ำหรับผู้ที่ไม่สามารถ รับภาระค่ารักษาพยาบาลของเอกชนได้ ส่วนเรื่องไพ่โป๊กเกอร์ นัน้ อย่างน้อยก็ 20 ปีมาแล้วจากทีผ่ มเคยเล่นกินเงินเล็กๆ น้อยๆ สิ่งเดียวที่ Newsweek พูดถูกคือทฤษฎีเกมจะใช้งานได้จริงเมื่อ มันถูกประยุกต์ใช้โดยผู้ที่รู้ว่าตัวเองก�ำลังท�ำอะไรอยู่ มันไม่ได้ ใช้ ก ารได้ แ ต่ ใ นสาขาเศรษฐศาสตร์ หากยั ง รวมถึ ง ในสาขา ชีววิทยาเชิงวิวัฒนาการและรัฐศาสตร์อีกด้วย ในหนังสือเมื่อ ไม่นานมานี้ของผมเรื่อง Natural Justice (ความยุติธรรมตาม ธรรมชาติ) ผมถึงกับท�ำให้พวกนักปรัชญาศีลธรรมดั้งเดิมโกรธ เป็นฟืนเป็นไฟเมื่อใช้ทฤษฎีเกมมาจับเรื่องจริยธรรม เกมเด็กเล่น การประมูลทีม่ มี ลู ค่าสูงในกิจการโทรคมนาคมแต่ละครัง้
A
Very Short Introduction
21
จะต้องมีการออกแบบเป็นการเฉพาะให้เหมาะสมกับสถานการณ์ ทีจ่ ะใช้ คุณไม่สามารถท�ำเพียงเลือกหยิบรูปแบบการประมูลหนึง่ จากชั้นวางแล้วเอามาใช้ได้ รัฐบาลสหรัฐอเมริกาเคยท� ำดังว่า คราวที่จ้างบริษัทซัทเทบีส์ (Sotheby’s) ให้จัดการประมูลขาย เครือ่ งรับส่งสัญญาณดาวเทียมจ�ำนวนหนึง่ แต่กไ็ ม่มใี ครสามารถ รวบรวมลักษณะทางเทคนิคที่ซับซ้อนของตลาดโทรคมนาคม ยุคใหม่ทั้งหมดนี้ลงในแบบจ�ำลองคณิตศาสตร์ได้ การออกแบบ การประมูลในกิจการโทรคมนาคมจึงเป็นทั้งศาสตร์และศิลป์ ไม่ยิ่งหย่อนไปกว่ากัน ทั้งยังต้องเป็นการออกแบบที่ต่อยอดจาก แบบจ�ำลองเรียบง่ายที่เลือกมาเพื่อเลียนแบบสิ่งที่เป็นลักษณะ ส�ำคัญเชิงกลยุทธ์ของปัญหา ผมพยายามจะท�ำสิง่ เดียวกันในหนังสือเล่มนี้ โดยจะไม่มี พีชคณิตและใช้ศัพท์เทคนิคให้น้อยที่สุด หนังสือเล่มนี้จะพินิจดู เฉพาะเกมเด็กเล่น โดยทิง้ ประเด็นแต่งเติมอืน่ ๆ ทีม่ คี วามซับซ้อน ในชีวิตจริง ถึงกระนั้นคนส่วนใหญ่ก็พบว่าแม้แต่เกมเด็กเล่น ยังให้อะไรแก่พวกเขาไว้คิดต่อมากมาย ความขัดแย้งและความร่วมมือ เกมเกือบทั้งหมดในหนังสือเล่มนี้มีผู้เล่นเพียง 2 คน คืออลิซและบ็อบ เกมแรกที่พวกเขาจะเล่นคือเกมจับคู่หัวก้อย (Matching Pennies) เชอร์ล็อก โฮล์มส์ และศาสตราจารย์มอริอาร์ตีจอม วายร้ายเล่นเกมจับคู่หัวก้อยระหว่างทางสู่การเผชิญหน้าครั้ง
22
Game
Theory
บ็อบ หัว
ก้อย
หัว
หัว
หัว
ก้อย
ก้อย
ก้อย
อลิซ
กลยุทธ์ของอลิซ
กลยุทธ์ของบ็อบ
ภาพประกอบ 1 ปัญหาการตัดสินใจของอลิซและบ็อบในเกมจับคู่หัวก้อย
สุดท้ายทีน่ ำ�้ ตกไรเชนบาค โฮล์มส์ตอ้ งตัดสินใจว่าจะลงจากรถไฟ ทีส่ ถานีใด ในขณะทีม่ อริอาร์ตตี อ้ งตัดสินใจเช่นกันว่าจะดักซุม่ รอ ทีส่ ถานีไหน นักบัญชีขฉี้ อ้ และผูต้ รวจสอบบัญชีเล่นเกมท�ำนองนี้ ในชีวิตจริง โดยฝ่ายแรกตัดสินใจว่าเมื่อไรจะโกงและฝ่ายหลัง ตัดสินใจว่าเมื่อใดจะตรวจสอบบัญชี ในเกมเด็กเล่นของเรา อลิซกับบ็อบเลือกหงายเหรียญ คนละเหรียญ อลิซจะชนะถ้าเหรียญทั้งสองหงายด้านเดียวกัน ส่วนบ็อบจะชนะถ้าเหรียญทั้งสองหงายด้านที่ต่างกัน ดังนั้น ทั้งอลิซและบ็อบจึงมีคนละ 2 กลยุทธ์ได้แก่ หัว และ ก้อย ภาพประกอบ 1 แสดงให้เห็นผู้ชนะและผู้แพ้ส�ำหรับทุกความ เป็นไปได้ในกลยุทธ์ที่ทั้งคู่ใช้ ผลลัพธ์ที่ได้คือ ผลตอบแทน (Payoffs) จากการเล่นเกม เราใช้สัญลักษณ์รูปนิ้วโป้งชี้ขึ้นและ นิ้วโป้งชี้ลงเพื่อเน้นให้เห็นว่าไม่จ�ำเป็นต้องวัดผลตอบแทนเป็น ตัวเงิน ภาพประกอบ 2 แสดงวิธีรวมข้อมูลทั้งหมดที่ได้จาก ภาพประกอบ 1 มาสร้างเป็นตารางผลตอบแทน โดยผลตอบแทน
A
Very Short Introduction
หัว
23
ซ้าย
ก้อย
หัว
ซ้าย
ก้อย
ขวา
ขวา
เกมจับคู่หัวก้อย เกมขับขี่ ภาพประกอบ 2 ตารางผลตอบแทน อลิซเลือกกลยุทธ์หนึง่ ตามแนวนอน (แถว) และบ็อบเลือกกลยุทธ์หนึ่งตามแนวตั้ง (หลัก)
ของอลิซอยูท่ มี่ มุ ซ้ายล่างของแต่ละช่องในตาราง ส่วนผลตอบแทน ของบ็ อ บอยู ่ ที่ มุ ม ขวาบน ภาพประกอบนี้ ยั ง แสดงเกมขั บ ขี่ (Driving Game) แบบมีผู้เล่น 2 คนที่ต่างจากเกมก่อนหน้าและ เราก็เล่นเกมนี้กันทุกเช้าหลังจากก้าวขึ้นรถและขับไปท�ำงาน เช่นเคย อลิซกับบ็อบมีกลยุทธ์ชัดแจ้ง (pure strategy) อยู่ 2 รูปแบบ ได้แก่ ซ้าย และ ขวา แต่ตอนนี้ผลตอบแทนของผู้เล่น ทั้งสองกลับสอดคล้องกันโดยสมบูรณ์ แทนที่จะขัดแย้งกันโดย สิน้ เชิง เวลานักข่าวพูดถึงสถานการณ์แบบ “วิน-วิน” นัน้ พวกเขา ก็นึกถึงบางอย่างที่คล้ายกับเกมขับขี่นี่แหละ ฟอน นอยมันน์ ผลการศึ ก ษาชิ้ น แรกของทฤษฎี เ กมคื อ ทฤษฎี บ ท มินิแม็กซ์ (minimax theorem) โดย จอห์น ฟอน นอยมันน์ (John von Neumann) ซึง่ ประยุกต์ใช้ได้เฉพาะในเกมทีส่ มมติให้ ผู้เล่นเป็นศัตรูที่ไม่มีทางประนีประนอมกันเท่านั้นดังเช่นในเกม
24
Game
Theory
จับคู่หัวก้อย ถึงตอนนี้บางคนก็ยังเชื่อถ้อยค�ำวิจารณ์ทฤษฎี เกมแบบไม่ให้ราคาที่ฟอน นอยมันน์ถูกล้อเป็นต้นแบบนักรบ สงครามเย็นซึง่ เป็นต้นตอของ ดร. สเตรนจ์เลิฟ (Dr. Strangelove) ในภาพยนตร์ชื่อดัง นอกจากนี้พวกเราอาจจะเคยได้ยินบางคน พูดว่า จะมีกแ็ ต่นกั วางกลยุทธ์ทางทหารจอมเพีย้ นเท่านัน้ ทีจ่ ะคิด ใช้ทฤษฎีเกมในชีวติ จริง เพราะมีแค่คนบ้าหรือไซบอร์กเท่านัน้ ที่ จะคิดแบบผิดๆ ไปว่าโลกนี้คือเกมแห่งความขัดแย้งโดยสิ้นเชิง ฟอน นอยมันน์คืออัจฉริยะรอบด้าน การคิดค้นทฤษฎี เกมเป็นเพียงอาชีพเสริม มันก็จริงอยูท่ เี่ ขาเป็นพวกสายเหยีย่ วใน ช่วงสงครามเย็น แต่นนั่ ก็ยงั ห่างไกลจากการเป็นไซบอร์กบ้าเลือด เขามีจิตอันเป็นมิตร ชอบสังสรรค์และสรรหาความสุข เขาก็ เหมื อ นกั บ คุ ณ และผมที่ ช อบความร่ ว มมื อ มากกว่ า ความ ขัดแย้ง แต่เขาก็เข้าใจดีวา่ หนทางแห่งการบรรลุความร่วมมือนัน้ ไม่ใช่การเสแสร้งว่ามนุษย์จะแสวงหาประโยชน์จากการสร้าง ปัญหาไม่ได้ ความร่วมมือและความขัดแย้งคือสองด้านของเหรียญ เดียวกัน เราไม่สามารถเข้าใจสิ่งหนึ่งได้ดีถ้าไม่พิจารณาอีกสิ่ง ควบคู่กันไป เราไม่ได้ท�ำความเข้าใจเกมแห่งความขัดแย้งโดย สิ้นเชิงอย่างเกมจับคู่หัวก้อยเพื่อที่จะสรุปว่าทุกการปฏิสัมพันธ์ ของมนุษย์คือการแข่งขัน ในท�ำนองเดียวกัน เราไม่ได้สรุปว่า ทุกการปฏิสัมพันธ์ของมนุษย์คือการร่วมมือเมื่อเราพิเคราะห์ เกมที่มีแต่การประสานความร่วมมือดังเช่นเกมขับขี่ เราเพียง แบ่งแยกพฤติกรรมสองด้านทีแ่ ตกต่างกันของมนุษย์ให้ชดั เพือ่ ที่ จะได้ศึกษาไปทีละอย่าง
A
Very Short Introduction
25
ความพึงใจที่เปิดเผย เพือ่ จะเข้าใจความร่วมมือและความขัดแย้งไปพร้อมๆ กัน เราต้องมีวธิ อี ธิบายแรงจูงใจของผูเ้ ล่นในเกมทีด่ กี ว่าการเอ่ยเพียง ว่าผู้เล่นชอบชนะและไม่ชอบแพ้ นักเศรษฐศาสตร์สร้างแนวคิด เกี่ยวกับ อรรถประโยชน์ (utility) ขึ้นเพื่อสนองจุดมุ่งหมายนี้ โดยผูเ้ ล่นแต่ละคนสามารถตีคา่ กับผลลัพธ์ทเี่ ป็นไปได้แต่ละแบบ ให้ออกมาเป็นตัวเลข ส�ำหรับธุรกิจ สิง่ ส�ำคัญทีส่ ดุ คือก�ำไร แต่นกั เศรษฐศาสตร์ รู้ว่ามนุษย์มักมีเป้าหมายที่ซับซ้อนกว่าแค่การหาเงินให้ได้มาก ที่สุด ดังนั้นเราจึงไม่สามารถระบุได้ว่าอรรถประโยชน์คือเงิน ทางแก้ซื่อๆ ก็คือการแทนที่เงินด้วยความสุข ว่าแต่อะไรคือ ความสุขกันล่ะ? แล้วเราจะวัดมันได้อย่างไร? โชคร้ายที่ค�ำว่า “อรรถประโยชน์” นั้นมีประวัติศาสตร์ เกี่ยวโยงกับนักอรรถประโยชน์นิยม (utilitarian) ยุควิกตอเรีย อย่าง เจเรมี เบนธัม (Jeremy Bentham) กับ จอห์น สจวร์ต มิลล์ (John Stuart Mill) เพราะนักเศรษฐศาสตร์สมัยใหม่นั้นไม่ได้ ระบุอรรถประโยชน์จากความรื่นรมย์หรือความเจ็บปวดของคน คนหนึ่งว่ามีมากน้อยเพียงไรตามแบบพวกเขาอีกต่อไปแล้ว ทฤษฎีสมัยใหม่ละเลิกความพยายามใดๆ ทีจ่ ะอธิบายพฤติกรรม ผู้คนด้วยการศึกษาว่าเกิดอะไรขึ้นในหัวของพวกเขาบ้าง ใน ทางตรงข้าม กลับเป็นคุณด้วยซ�้ำที่มันไม่ตั้งข้อสมมติใดๆ ทาง จิตวิทยาเลย เราจะไม่พยายามอธิบายว่า ท�ำไม อลิซกับบ็อบถึงมี
26
Game
Theory
พฤติกรรมแบบทีเ่ ป็นอยู่ แทนทีจ่ ะหาทฤษฎีเชิงอธิบาย (explanatory theory) เราจ�ำต้องพอใจกับทฤษฎีเชิงพรรณนา (descriptive theory) ซึ่งท�ำอะไรไม่ได้มากไปกว่าการบอกว่าอลิซหรือบ็อบ ประพฤติตัวไม่เสมอต้นเสมอปลายถ้าพวกเขาท�ำ “อย่างนั้น อย่างนี้” ในอดีต แต่ว่าตอนนี้กลับวางแผนที่จะท�ำ “สิ่งนี้สิ่งนั้น” ในอนาคต เป้าหมายของทฤษฎีเกมคือเพื่อสังเกตการตัดสินใจ ที่อลิซกับบ็อบเลือก (หรืออาจเลือก) ในตอนที่ทั้งสองไม่ต้อง ปฏิสัมพันธ์กันหรือกับใครอื่น และเพื่อสรุปเชิงนิรนัยว่าพวกเขา จะมีพฤติกรรมอย่างไรหากต้องปฏิสัมพันธ์ในเกม ดังนั้นเราจะไม่เถียงกันว่าความพึงใจ (preference) ลักษณะไหนมีเหตุมีผลกว่ากัน เราเชื่อตามนักปรัชญาผู้ยิ่งใหญ่ เดวิด ฮูม (David Hume) ที่มองว่า เหตุผลคือ “ทาสของความ ปรารถนา” อย่างทีเ่ ขาได้เคยกล่าวไว้เสียเลยเถิดว่า มันไม่มอี ะไรที่ ไร้เหตุไร้ผล เลยสักนิดหากเขาพึงใจให้จักรวาลทั้งหมดล่มสลาย มลายไปมากกว่าจะยอมให้นวิ้ เขามีรอยขีดข่วน อย่างไรก็ดี ในวิถี นี้เราไปได้ไกลกว่านั้นด้วยการมองเหตุผลว่าเป็นแค่เครื่องมือ ส�ำหรับการหลีกเลี่ยงพฤติกรรมที่ไม่เสมอต้นเสมอปลายเท่านั้น ดังนั้นพฤติกรรมใดๆ ที่เสมอต้นเสมอปลายจึงถือว่ามีเหตุมีผล ด้วยข้อสมมติอ่อนๆ บางข้อ เราสามารถแสดงให้เห็น ว่าการปฏิบตั ติ นทีเ่ สมอต้นเสมอปลายนัน้ เป็นสิง่ เดียวกันกับการ ประพฤติราวกับว่าพยายามท�ำให้บางสิ่งมีค่ามากที่สุด ซึ่งไม่ว่า บางสิ่งนั้นจะเป็นอะไรในบริบทหนึ่งๆ นักเศรษฐศาสตร์ได้เรียก มันว่า อรรถประโยชน์ แม้ว่ามันไม่จ�ำเป็นต้องสัมพันธ์กับเงิน แต่ น่าเศร้าที่บ่อยครั้งมันเป็นเช่นนั้น
A
Very Short Introduction
27
รับความเสี่ยง ในการปฏิบัติตนเสมอต้นเสมอปลาย อลิซอาจไม่ได้ ตระหนักว่าตัวเธอเองก็ก�ำลังประพฤติตนราวกับว่าพยายาม ท�ำให้ “บางสิ่ง” ที่เราเรียกว่าอรรถประโยชน์ของเธอมีค่าสูงที่สุด แต่ถ้าเราต้องการจะคาดการณ์พฤติกรรมของเธอ เราจ�ำต้องวัด อรรถประโยชน์ของเธอด้วยมาตรวัดอรรถประโยชน์ (utility scale) ดังเช่นที่เราวัดอุณหภูมิโดยใช้เทอร์โมมิเตอร์ และเหมือนกับที่ หน่วยวัดในเทอร์โมมิเตอร์เรียกว่า องศา เราก็เรียกหน่วยวัดบน มาตรวัดอรรถประโยชน์ของอลิซได้ว่า ยูทิล (util) แนวคิดดั้งเดิมในวิชาเศรษฐศาสตร์เคยมองว่าการใช้ มาตรวัดอรรถประโยชน์แบบจ�ำนวนนับ (cardinal utility scale) เป็นเรื่องไร้สาระโดยแท้ แต่โชคดีที่ฟอน นอยมันน์ไม่รู้เรื่องนี้ มาก่อนตอนที่ ออสการ์ มอร์เกนสเติรน์ (Oskar Morgenstern) มาหา เขาที่บ้านในวันหนึ่งเพื่อระบายให้ฟังว่า พวกเขาไม่มีพื้นฐานที่ ดีพอในการรองรับการใช้ผลตอบแทนที่เป็นตัวเลข (numerical payoffs) ในหนังสือทฤษฎีเกมทีท่ งั้ สองก�ำลังเขียนขึน้ ด้วยกัน เมือ่ ได้ยินดังนั้น ฟอน นอยมันน์จึงคิดค้นทฤษฎีหนึ่งขึ้นมา ณ จุดนั้น ทันที มันคือทฤษฎีที่ใช้วัดว่าอลิซต้องการบางสิ่งมากขนาดไหน โดยใช้ขนาดของความเสี่ยงที่เธอยินดีจะรับเพื่อให้ได้มันมาเป็น ตัววัด ด้วยทฤษฎีดงั กล่าว เราสามารถคาดได้วา่ เธอจะเลือกทาง ไหนภายใต้สถานการณ์เสี่ยงจากการค�ำนวณหาทางเลือกที่ให้ อรรถประโยชน์กับเธอสูงสุดโดยเฉลี่ย มันง่ายที่จะใช้ทฤษฎีของฟอน นอยมันน์หาว่าจะตีค่า
28
Game
Theory
ตั ว เลขอรรถประโยชน์ จ ากสิ่ ง ต่ า งๆ ที่ อ ลิ ซ อาจประเมิ น ไว้ ยกตัวอย่างเช่น อลิซน่าจะตีค่าอรรถประโยชน์ที่ได้จากการ ออกเดตกับบ็อบกี่ยูทิล? ขั้นแรกเราต้องเลือกมาตรวัดอรรถประโยชน์ที่จะใช้ เสียก่อน โดยเลือกผลลัพธ์ (outcomes) สองแบบที่ดีที่สุดและแย่ ทีส่ ดุ ตามล�ำดับเมือ่ เทียบกับผลลัพธ์อนื่ ๆ ทัง้ หมดทีอ่ าจจะเกิดขึน้ กับอลิซ ผลลัพธ์ทั้งสองเปรียบได้กับจุดเดือดและจุดเยือกแข็ง ของน�้ำซึ่งใช้เพื่อสร้างหน่วยอุณหภูมิวัดในเทอร์โมมิเตอร์แบบ เซลเซียส โดยมาตรวัดอรรถประโยชน์ที่เราจะสร้างนี้ก�ำหนดให้ ผลลัพธ์ที่แย่ที่สุดมีค่า 0 ยูทิล และ 100 ยูทิลส�ำหรับผลลัพธ์ที่ดี ที่สุด ในขั้นต่อมาลองนึกถึงลอตเตอรี่ (ฟรี) หลายๆ ใบ ซึ่งรางวัล ที่ให้มีแต่ผลลัพธ์ที่ดีที่สุดหรือไม่ก็ผลลัพธ์ที่แย่ที่สุดเท่านั้น ถ้าเราเสนอลอตเตอรีใ่ ห้กบั อลิซเลือกทีละใบซึง่ แต่ละใบ จะมีโอกาสได้ผลลัพธ์ที่ดีที่สุดมากขึ้นเรื่อยๆ เพื่อแลกกับการ ได้ออกเดตกับบ็อบ ในที่สุดแล้วอลิซก็จะเปลี่ยนจากการตอบว่า ไม่ เป็นการตอบ ตกลง หากลอตเตอรี่ใบที่ท�ำให้เธอเปลี่ยนใจมี ความน่าจะเป็นที่จะได้ผลลัพธ์ที่ดีที่สุดเท่ากับ 75% แล้ว ทฤษฎี ของฟอน นอยมันน์บอกว่าการได้ออกเดตกับบ็อบมีค่า 75 ยูทิล ส�ำหรับอลิซ แต่ละเปอร์เซ็นต์ทเี่ พิม่ ขึน้ จากความน่าจะเป็นทีท่ ำ� ให้ ไม่รู้สึกถึงความต่าง (indifference probability) จึงสอดคล้องกับ การได้รับอรรถประโยชน์เพิ่มขึ้น 1 ยูทิล ถ้าใครประเมินอรรถประโยชน์ของเงินด้วยวิธีนี้แล้ว พบว่าเขาให้ค่าเงิน 1 ดอลลาร์ที่เพิ่มขึ้นมาเป็นหน่วยยูทิลที่ เท่าเดิมเสมอ เราเรียกคนกลุ่มนี้ว่าเป็นกลางกับความเสี่ยง (risk
A
Very Short Introduction
29
neutral) ส่วนคนที่ให้ค่าเงินแต่ละดอลลาร์ที่ได้มาใหม่เป็นยูทิล น้อยลงจากเงินดอลลาร์ทไี่ ด้กอ่ นหน้านัน้ จะถูกเรียกว่าหลีกเลีย่ ง ความเสี่ยง (risk averse) การประกัน อลิ ซ ก� ำ ลั ง คิ ด อยู ่ ว ่ า จะรั บ ข้ อ เสนอของบ็ อ บในการ ท�ำประกันคฤหาสน์ของเธอทีเ่ บเวอร์ลยี ฮ์ ลิ ส์จากอัคคีภยั ดีหรือไม่ ถ้าเธอปฏิเสธข้อเสนอของเขา สถานการณ์จะเหมือนกับว่าเธอ ได้รับลอตเตอรี่ซึ่งให้ผลลัพธ์ที่จบลงด้วยการที่เธอยังมีทั้งบ้าน และเงินค่าเบี้ยประกัน (insurance premium) อยู่ครบหากบ้าน ของเธอไม่ถูกไฟไหม้ และเธอจะเหลือแค่เงินค่าเบี้ยประกันหาก บ้านถูกไฟไหม้ เราจะต้องน�ำสถานการณ์ดงั กล่าวมาเปรียบเทียบ กับกรณีที่เธอรับข้อเสนอของบ็อบ ซึ่งเธอจะได้รับผลตอบแทน เท่ากับมูลค่าบ้านหักลบด้วยเงินค่าเบีย้ ประกันอย่างแน่นอน ไม่วา่ บ้านจะไฟไหม้หรือไม่ก็ตาม ถ้าหากมันมีเหตุมีผลที่บ็อบจะเสนอประกันและอลิซจะ รับข้อเสนอนั้น บ็อบก็ต้องคิดแล้วว่าการเสนอลอตเตอรี่ให้ผลดี กว่าการคุ้มทุนแน่นอน และอลิซต้องมีความพึงใจที่ตรงกันข้าม การมีอยู่ของอุตสาหกรรมประกันภัยจึงไม่เพียงยืนยันว่าการ พนั น เป็ น สิ่ ง ที่ มี เ หตุ มี ผ ลได้ ห ากความเสี่ ย งที่ คุ ณ ตั ด สิ น ใจรั บ มาเป็นความเสี่ยงซึ่งคิดค�ำนวณมาแล้ว แต่มันยังชี้ว่าคนที่คิด อย่างมีเหตุมีผลอาจมีทัศนคติในการรับความเสี่ยงที่แตกต่างกัน ในอุตสาหกรรมประกันภัย ผู้รับประกันนั้นใกล้เคียงกับการเป็น
30
Game
Theory
กลางกับความเสี่ยง ในขณะที่ผู้เอาประกันเป็นผู้หลีกเลี่ยงความ เสี่ยงในระดับที่แตกต่างกันไป โปรดสังเกตว่านักเศรษฐศาสตร์ถือว่าระดับของการ หลีกเลี่ยงความเสี่ยงที่แต่ละคนเผยออกมานั้นมีลักษณะเป็น ความพึงใจส่วนบุคคล เช่นเดียวกับทีอ่ ลิซอาจจะพึงใจในไอศกรีม ช็อกโกแลตมากกว่าไอศกรีมวานิลลาหรือไม่กไ็ ด้ ฉะนีเ้ ธอจึงอาจ พึงใจที่จะจ่ายเงิน 1,000 ดอลลาร์ไปกับการท�ำประกันภัยบ้าน ของเธอหรือไม่ก็ได้ นักปรัชญาบางคนโดยเฉพาะ จอห์น รอลส์ (John Rawls) ยืนกรานว่ามัน มีเหตุมีผล ที่จะเป็นคนหลีกเลี่ยง ความเสีย่ งเมือ่ พวกเขาต้องปกป้องทางเลือกทีต่ นพึงใจนอกเหนือ จากทางเลือกที่ให้อรรถประโยชน์เฉลี่ยสูงสุด แต่ค�ำกล่าวนี้หลุด ประเด็นที่ว่า ทัศนคติในการรับความเสี่ยงของผู้เล่นนั้นรวมอยู่ ในวิธีของฟอน นอยมันน์ที่ใช้ตีค่าอรรถประโยชน์ส�ำหรับผลลัพธ์ หนึ่งๆ เรียบร้อยแล้ว นักเศรษฐศาสตร์หลายคนเข้าใจผิดในเรือ่ งทีต่ า่ งออกไป เมื่อพวกเขาโยงการหลีกเลี่ยงความเสี่ยงว่ามีเหตุจากการไม่ ชอบการพนันขันต่อ ทฤษฎีของฟอน นอยมันน์นั้นจะเข้าท่า ก็ตอ่ เมือ่ ผูเ้ ล่นเป็นกลางโดยสิน้ เชิงกับการเล่นพนัน ดังเช่นการที่ ศาสนาจารย์นกิ ายเพรสไบทีเรียนท�ำประกันบ้านของเขา พวกเขา ไม่ได้พนันเพราะว่าชอบเล่นการพนัน แต่พวกเขาจะพนันก็ตอ่ เมือ่ พิจารณาแล้วว่าโอกาสนั้นเอื้อประโยชน์แก่เขา ชีวิตไม่ใช่เกมผลรวมเป็นศูนย์ เช่นเดียวกับการวัดอุณหภูมิ เรามีอิสระในการเลือกค่า
A
Very Short Introduction
31
ศูนย์และหน่วยบนมาตรวัดอรรถประโยชน์ของอลิซอย่างไรก็ได้ ตามต้องการ ยกตัวอย่างเช่น เราอาจจะให้ค่า 32 ยูทิลส�ำหรับ ผลลัพธ์ที่แย่ที่สุด และ 212 ยูทิลส�ำหรับผลลัพธ์ที่ดีที่สุด ตัวเลข ยูทิลที่แสดงค่าส�ำหรับการออกเดตกับบ็อบบนมาตรวัดใหม่นี้ ค�ำนวณได้ด้วยวิธีเดียวกันกับการแปลงองศาเซลเซียสให้เป็น องศาฟาเรนไฮต์ ดังนัน้ การออกเดตกับบ็อบทีม่ คี า่ เท่ากับ 75 ยูทลิ ในมาตรวัดเดิมจะมีค่า 167 ยูทิลในมาตรวัดใหม่ ในเกมเด็กเล่นที่เราได้พิจารณากันมานั้น อลิซกับบ็อบ มี 2 ผลลัพธ์ที่ต้องประเมินเพียงแค่ ชนะ และ แพ้ เรามีอิสระที่จะ ให้คา่ กับผลลัพธ์ทงั้ สองเป็นยูทลิ เท่าใดก็ได้ตามใจ ตราบเท่าทีค่ า่ ยูทลิ ทีเ่ ราให้กบั การชนะมีคา่ มากกว่าการแพ้ ถ้าเราให้คา่ +1 ยูทลิ กับการชนะและ -1 ยูทิลกับการแพ้ เราจะได้ตารางผลตอบแทน ตามภาพประกอบ 3 ผลตอบแทนในแต่ ล ะช่ อ งของเกมจั บ คู ่ หั ว ก้ อ ยใน ภาพประกอบ 3 รวมกันแล้วเท่ากับศูนย์เสมอ เราสามารถ ปรับเปลี่ยนสิ่งต่างๆ ให้เกมแห่งความขัดแย้งโดยสิ้นเชิงเป็นจริง ตามนี้ได้เสมอ ดังนั้นจึงกล่าวได้ว่าเกมแบบนี้มี ผลรวมเป็นศูนย์ (zero sum) เมื่อมีผู้รู้บอกเราว่าชีวิตไม่ใช่เกมผลรวมเป็นศูนย์ พวกเขาจึงไม่ได้พูดอะไรเกี่ยวกับผลรวมของความสุขในโลก แต่แค่ย�้ำเตือนเราว่าเกมที่เราเล่นกันในชีวิตจริงนั้น น้อยครั้งนัก ที่จะเป็นเกมแห่งความขัดแย้งโดยสิ้นเชิง ดุลยภาพแนช ภาพยนตร์เก่าเรื่อง Rebel without a Cause (ขบถใน
32
Game
หัว
ก้อย
ซ้าย
หัว
ซ้าย
ก้อย
ขวา เกมจับคู่หัวก้อย
Theory
ขวา
เกมขับขี่
ภาพประกอบ 3 ผลตอบแทนที่เป็นตัวเลข
สายเลือด) ยังออกฉายอยู่บ้างเป็นครั้งคราว เพราะว่ามีดาราที่ ยากจะลืมเลือนอย่าง เจมส์ ดีน (James Dean) รับบทเป็นวัยรุ่น ขบถเลือดร้อนสุดเซ็กซี่ เกมไก่ออ่ น (game of Chicken) ถูกสร้าง ขึ้นเพื่อระลึกถึงฉากหนึ่งในหนังที่เขาและเด็กหนุ่มอีกคนขับรถ พุ่งไปยังขอบผาสูงเพื่อดูว่าใครจะกลัวหัวหดจนหยุดรถก่อนกัน นอกจากนีย้ งั เป็นทีท่ ราบกันดีวา่ เบอร์ทรันด์ รัสเซลล์ (Bertrand Russell) ก็ใช้ฉากนี้เพื่ออุปมาถึงสถานการณ์ช่วงสงครามเย็น ผมชอบที่จะอธิบายสถานการณ์ของเกมไก่อ่อนด้วย เรื่องราวที่ออกจะน่าเบื่อกว่านี้สักนิด นั่นคือ อลิซและบ็อบเป็นผู้ ขับขี่วัยกลางคนที่ก�ำลังขับรถเข้าหากันในซอยที่แคบเกินกว่าที่ ทั้งสองจะสวนกันได้อย่างปลอดภัยหากไม่มีใครชะลอรถ ดังนั้น กลยุทธ์ในภาพประกอบ 4 คือ ชะลอ หรือ เร่ง ความเร็ว บริบทใหม่นี้ลดความส�ำคัญขององค์ประกอบด้านการ แข่งขันในเรือ่ งราวเดิมลง เกมไก่ออ่ นแตกต่างจากเกมผลรวมเป็น ศูนย์อย่างเกมจับคู่หัวก้อยตรงที่ผู้เล่นยังมีผลประโยชน์ตรงกัน ในการหลีกเลี่ยงหายนะร่วม
A
Very Short Introduction
ชะลอ
33
เร่ง
บัลเลต์
ชะลอ
บัลเลต์
เร่ง
มวย เกมไก่อ่อน
มวย
เกมศึกต่างเพศ
ภาพประกอบ 4 เกมที่มีแรงจูงใจผสม
การเหมารวม (stereotype) ทีฝ่ งั ลึกอยูใ่ นเกมศึกต่างเพศ (Battle of the Sexes) นั้นมีมาก่อนขบวนการปลดแอกสตรี อลิซ กับบ็อบเป็นคู่ข้าวใหม่ปลามันซึ่งก�ำลังดื่มน�้ำผึ้งพระจันทร์กันที่ นครนิวยอร์ก ระหว่างอาหารเช้า ทั้งคู่ปรึกษากันว่าค�่ำนี้จะไปชม การชกมวยหรือบัลเลต์ดี แต่ทั้งสองกลับไม่สามารถตัดสินใจได้ หลังจากนั้นทั้งคู่เกิดพลัดหลงกันในฝูงชนและต่างคนต่างต้อง ตัดสินใจโดยล�ำพังว่าจะไปที่ไหนในช่วงค�่ำ เรื่องราวของเกมศึกต่างเพศช่วยเน้นความส�ำคัญของ ลักษณะความร่วมมือในปัญหาทีท่ งั้ สองเผชิญ แต่ในขณะเดียวกัน ก็มีลักษณะของความขัดแย้งซึ่งไม่ปรากฏในเกมขับขี่ เนื่องจาก ผู้เล่นแต่ละคนนั้นพึงใจที่จะประสานความร่วมมือกันแต่เพื่อให้ ได้ผลลัพธ์คนละแบบ นั่นคือ อลิซอยากดูบัลเลต์ ส่วนบ็อบอยาก ดูมวย
34
Game
Theory
ภาพประกอบ 5 เจมส์ ดีน
จอห์น แนช ทุกคนคุ้นชื่อ จอห์น แนช (John Nash) เพราะชีวิตของ เขาถูกถ่ายทอดออกมาในภาพยนตร์เรือ่ ง A Beautiful Mind และ อย่างที่ภาพยนตร์ได้ฉายให้เห็น จุดสูงสุดและจุดตกต�่ำของชีวิต เขานั้นอยู่นอกกรอบประสบการณ์ชีวิตของคนส่วนใหญ่ เขายัง เป็นเพียงนักศึกษาระดับปริญญาตรีตอนที่ริเริ่มทฤษฎีสมัยใหม่ ของการเจรจาต่อรองอย่างมีเหตุมผี ล วิทยานิพนธ์ระดับปริญญา เอกของเขาได้สร้างมโนทัศน์เรื่องดุลยภาพแนช (Nash equilibrium) ซึง่ ในปัจจุบนั ได้รบั การยอมรับว่าเป็นองค์ประกอบพืน้ ฐาน ของทฤษฎีเกม เขายังไม่หยุดแค่นั้น เพราะยังได้แก้โจทย์ส�ำคัญ ทั้งหลายในสาขาวิชาคณิตศาสตร์บริสุทธิ์ (pure mathematics) ด้วยวิธกี ารทีส่ ร้างสรรค์และแปลกใหม่ จนสร้างชือ่ เสียงให้กบั เขา อย่างกว้างขวางในฐานะอัจฉริยะทางคณิตศาสตร์ชนั้ หนึง่ แต่เขา ก็ตกเป็นเหยื่อของโรคจิตเภท (schizophrenia) ซึ่งท�ำลายอาชีพ
A
Very Short Introduction
35
ภาพประกอบ 6 จอห์น แนช
การงานของเขา และท้ายสุดยังทิ้งให้เขาร่วงโรยไร้ตัวตน เหลือ เป็นเพียงวัตถุแห่งการล้อเลียนที่มหาวิทยาลัยพรินซ์ตันเป็น ครั้งคราวถึงกว่า 40 ปี การฟื้นตัวจากอาการป่วยทันเวลาที่จะได้ รับรางวัลโนเบลในปี 1994 ก็เหมือนปาฏิหาริยเ์ มือ่ มองย้อนกลับไป แต่ก็อย่างที่แนชได้กล่าวไว้ ถ้าหากไม่เป็นเพราะ “ความบ้า”
36
Game
Theory
ของเขา เขาก็อาจจะเป็นเพียงแค่หนึง่ ในฝูงชนไร้ตวั ตนซึง่ เกิดและ ตายบนดาวเคราะห์ดวงนีโ้ ดยทีม่ ไิ ด้ทงิ้ แม้เพียงเศษเสีย้ วแห่งการ ด�ำรงอยู่ของตนเองไว้เบื้องหลัง ยังดีที่เราไม่ถึงกับต้องเป็นอัจฉริยะหลุดโลก เพื่อที่จะ เข้าใจแนวคิดของดุลยภาพแนช เราได้เห็นแล้วว่าผลตอบแทน ในเกมนั้นถูกเลือกให้ตรงกับการแสวงหาผลตอบแทนเฉลี่ยที่สูง ทีส่ ดุ ของผูเ้ ล่นทีม่ เี หตุมผี ล ซึง่ นัน่ เป็นเรือ่ งง่ายมากหากผูเ้ ล่นรูว้ า่ ผู้เล่นฝ่ายตรงข้ามจะเลือกกลยุทธ์อะไร ยกตัวอย่างเช่น หาก อลิซรู้ว่าบ็อบจะเลือก บัลเลต์ ในเกมศึกต่างเพศ เธอจะได้รับ ผลตอบแทนสูงสุดหากเธอเลือก บัลเลต์ เช่นกัน กล่าวได้ว่าการ เลือก บัลเลต์ คือการโต้ตอบที่ดีที่สุด (best reply) ของอลิซต่อ การเลือก บัลเลต์ ของบ็อบ ภาพประกอบ 4 แสดงข้อเท็จจริงนี้ โดยวงกลมล้อมรอบผลตอบแทนของอลิซในช่องที่ผู้เล่นทั้งสอง เลือก บัลเลต์ ดุลยภาพแนชก็คือกลยุทธ์คู่ที่หากใช้จะให้ผลดังช่องที่ ผลตอบแทน ทั้งสองค่า มีวงกลมล้อมรอบนั่นเอง ซึ่งโดยทั่วไป แล้ว ดุลยภาพแนชจะเกิดขึ้นเมื่อผู้เล่นทุกคนเลือกกลยุทธ์การ โต้ตอบที่ดีที่สุดต่อกลยุทธ์ที่คนอื่นเลือกโดยพร้อมเพรียงกัน ดัง้ นัน้ ทัง้ (มวย, มวย) และ (บัลเลต์, บัลเลต์) ก็คอื ดุลยภาพ แนชในเกมศึกต่างเพศ ในท�ำนองเดียวกัน (ชะลอ, เร่ง) และ (เร่ง, ชะลอ) คือดุลยภาพแนชในเกมไก่อ่อน ท�ำไมเราถึงควรสนใจดุลยภาพแนช? มีเหตุผลส�ำคัญ 2 ข้อต่อค�ำถามดังกล่าว เหตุผลแรกคือเราเชื่อว่าผู้เล่นที่มีเหตุ มีผลตามอุดมคติจะใช้เหตุผลแสวงหาหนทางแก้ปัญหาของเกม
A
Very Short Introduction
37
เหตุผลที่สองคือเราเชื่อว่าผู้คนแสวงหาหนทางในการแก้ปัญหา ด้วยกระบวนการวิวัฒนาการของการลองผิดลองถูกบางอย่าง อ�ำนาจการพยากรณ์ของทฤษฎีเกมโดยส่วนใหญ่มาจากความ เป็นไปได้ที่จะใช้ทางเลือกในการตีความทั้งสองสลับกันไปมาได้ บ่ อ ยครั้ ง ที่ เ ราไม่ ใ คร่ รู ้ ร ายละเอี ย ดเกี่ ย วกั บ กระบวนการ วิวฒ ั นาการนัก แต่บางครัง้ เราก็สามารถกระโดดข้ามไปพยากรณ์ ว่าท้ายที่สุดเกมจะจบลงตรงไหน ด้วยการตั้งค�ำถามว่าผู้เล่นที่ มีเหตุมีผลจะท�ำอย่างไรในสถานการณ์ที่ก�ำลังศึกษาอยู่นี้ การตีความเชิงการคิดอย่างมีเหตุมผี ล สมมติ ว ่ า ใครบางคนที่ ฉ ลาดยิ่ ง กว่ า แนชหรื อ ฟอน นอยมันน์เขียนหนังสือขึน้ มาเล่มหนึง่ โดยรวบรวมเกมทัง้ หมดที่ เป็นไปได้พร้อมทัง้ ให้คำ� แนะน�ำน่าเชือ่ ถือเกีย่ วกับวิธเี ล่นทีผ่ เู้ ล่นที่ มีเหตุมผี ลควรจะใช้ในแต่ละเกม หนังสือชัน้ ยอดขนาดนัน้ จ�ำต้อง เลือกดุลยภาพแนชให้เป็นค�ำตอบของแต่ละเกมอย่างหลีกเลี่ยง ไม่ได้ มิฉะนัน้ แล้วจะมีผเู้ ล่นอย่างน้อยหนึง่ รายทีพ่ บว่ามีเหตุมผี ล ที่ จ ะไม่ ป ฏิ บั ติ ต ามค� ำ แนะน� ำ ของหนั ง สื อ และกลายเป็ น ว่ า ค�ำแนะน�ำดังกล่าวไม่น่าเชื่อถือในที่สุด ตัวอย่างเช่น สมมติว่าหนังสือเล่มดังกล่าวแนะน�ำให้ เด็กหนุ่มทั้งสองที่ขับรถในเกมไก่อ่อนเลือก ชะลอ อย่างที่พวก แม่ๆ ต้องการ หากหนังสือเล่มนีน้ า่ เชือ่ ถือ ผูเ้ ล่นแต่ละคนก็จะรูว้ า่ อีกฝ่ายจะเลือก ชะลอ แต่ถ้าผู้เล่นที่มีเหตุมีผลในเกมไก่อ่อนรู้ ว่าคู่แข่งของตนจะเลือก ชะลอ เขาก็จะเลือก เร่ง อย่างแน่นอน
38
Game
Theory
นัน่ ก็เท่ากับเป็นการปฏิเสธค�ำกล่าวอ้างว่าหนังสือเล่มนีน้ า่ เชือ่ ถือ สังเกตได้ว่าการให้เหตุผลเพื่อสนับสนุนดุลยภาพแนช ข้างต้นนั้นวนเป็นวงกลม นั่นคือ ท�ำไมอลิซถึงเล่นแบบนี้ล่ะ? ก็เพราะว่าบ็อบเล่นแบบนัน้ ไง แล้วท�ำไมบ็อบถึงเล่นแบบนัน้ ล่ะ? ก็เพราะว่าอลิซเล่นแบบนี้ไง มี ศั พ ท์ แ สงภาษาละติ น ให้ ใ ช้ ม ากมายส� ำ หรั บ ผู ้ ที่ ไ ม่ สบอารมณ์กับการให้เหตุผลเป็นวงกลมแบบนั้น ครั้งแรกที่โดน กล่าวหาว่าใช้เหตุผลวิบตั แิ บบ circulus in probando (การพิสจู น์ แบบวนเป็นวงกลม) เมือ่ พูดถึงดุลยภาพนี้ ผมถึงต้องกลับไปค้นดู ความหมายของมันเลยทีเดียว ซึง่ ก็พบว่าผมนัน้ โชคดีมากทีไ่ ม่ถกู กล่าวหาในความผิดทีน่ า่ เสือ่ มเสียอับอายยิง่ กว่านัน้ อย่าง petitio principii (การแฝงข้อสรุปไว้ในข้อสมมติ) แต่แน่นอนว่าการให้ เหตุผลทั้งหลาย หากไม่วนเวียนไปมาเป็นวงกลม ก็จะเป็นการ ให้เหตุผลต่อเนื่องไม่รู้จบ (infinite regression) หากยังมีคน ไม่เลิกถามว่า ท�ำไม ตัวอย่างที่เราคุ้นเคยดีได้แก่ค�ำจ�ำกัดความ ทั้งหลายในพจนานุกรม ในเกมต่างๆ เราอาจจะนึกถึงการให้เหตุผลต่อเนื่อง ไม่รู้จบที่เริ่มด้วย... อลิซคิดว่า บ็อบคิดว่า อลิซคิดว่า บ็อบคิด...
หรือไม่เราก็ต้องเลี่ยงไปสู่การให้เหตุผลเป็นวงกลมซึ่ง ฝังลึกอยู่ในโครงสร้างของแนวคิดดุลยภาพแนช วิธีนี้จะช่วยเรา ให้ลัดวงจรการให้เหตุผลต่อเนื่องไม่รู้จบ ด้วยการสังเกตว่ากลุ่ม
A
Very Short Introduction
39
กลยุทธ์ที่เล่น (strategy profile) อื่นๆ จะเสื่อมเสถียรภาพเมื่อ ผู้เล่นเริ่มคิดว่าผู้เล่นคนอื่นๆ ก�ำลังคิดอะไรอยู่ หรือถ้าจะพูด อีกแบบคือ เมื่อไหร่ก็ตามที่ความเชื่อของผู้เล่นทั้งหลายที่มี ต่อแผนการของผู้เล่นแต่ละรายมีความสอดคล้องแล้ว ผู้เล่น เหล่านั้นต้องอยู่ในดุลยภาพ การตีความเชิงวิวัฒนาการ การตี ค วามเชิ ง การคิ ด อย่ า งมี เ หตุ มี ผ ลนั้ น ครอบง� ำ นั ก ทฤษฎี เ กมยุ ค แรกได้ ถึ ง ขนาดที่ ท� ำ ให้ ก ารตี ค วามเชิ ง วิวัฒนาการถูกละเลยแทบจะโดยสิ้นเชิง พวกบรรณาธิการของ วารสารวิชาการที่แนชตีพิมพ์บทความเกี่ยวกับดุลยภาพถึงกับ ให้ความเห็นเกี่ยวกับประเด็นนี้ว่าไม่น่าสนใจเอาเสียเลย! แต่ ทฤษฎีเกมจะไม่สามารถคาดการณ์พฤติกรรมของคนธรรมดา ทั่วไปได้เลยหากการตีความเชิงวิวัฒนาการนั้นไม่สมเหตุสมผล ตัวอย่างเช่น นักคณิตศาสตร์ชื่อดัง เอมีล บอแรล (Émile Borel) ครุน่ คิดเกีย่ วกับทฤษฎีเกมก่อนฟอน นอยมันน์ แต่กลับได้ขอ้ สรุป ว่าทฤษฎีบทมินิแม็กซ์อาจเป็นเท็จ แล้วมันจะมีความหวังอะไร หลงเหลือส�ำหรับพวกเราอีกเล่า หากขนาดคนทีฉ่ ลาดหลักแหลม อย่างบอแรลยังไม่สามารถให้เหตุผลเพือ่ แก้โจทย์เกมทีเ่ รียบง่าย ที่สุดแบบนี้ได้! มีการตีความดุลยภาพแนชเชิงวิวัฒนาการที่เป็นไปได้ มากมาย โดยแต่ ล ะค� ำ อธิ บ ายนั้ น แตกต่ า งกั น ในส่ ว นของ กระบวนการปรับตัวของผู้เล่นเข้าสู่ดุลยภาพ ในกระบวนการ
40
Game
Theory
ปรั บ ตั ว แบบง่ า ยๆ ผลตอบแทนในเกมจะถู ก บ่ ง ชี้ จ ากความ แข็งแกร่งของผู้เล่นกับเกมว่ามีมากน้อยแค่ไหน กระบวนการ ต่างๆ ที่ให้ประโยชน์กับกลยุทธ์ที่มีความแข็งแกร่งกว่าบนความ สู ญ เสี ย ของพวกที่ ป ระสบความส� ำ เร็ จ น้ อ ยกว่ า จะหยุ ด ลงได้ ก็ต่อเมื่อเราเข้าสู่ดุลยภาพแนช เพราะต้องถึงตอนนั้นเท่านั้น ที่กลยุทธ์ซึ่งอยู่รอดจะมีความแข็งแกร่งที่สุดเท่าที่จะเป็นไปได้ ภายใต้ ส ถานการณ์ ที่ เ ป็ นอยู ่ ดั ง นั้ นเราไม่ ไ ด้ ถึ ง กั บ ต้ อ งการ ผู้เล่นที่หลักแหลมทางคณิตศาสตร์เพื่อให้ดุลยภาพแนชสัมพันธ์ กับความจริง บ่อยครั้งที่พวกมันสามารถพยากรณ์พฤติกรรม ของสัตว์ได้เป็นอย่างดี นอกจากนี้นัยส�ำคัญเชิงวิวัฒนาการของ ดุลยภาพแนชนั้นก็ไม่ได้จ�ำกัดอยู่แต่ในสาขาชีววิทยาเท่านั้น มั น ยั ง ท� ำ หน้ า ที่ พ ยากรณ์ ไ ด้ ทุ ก ครั้ ง ที่ ก ระบวนการปรั บ ตั ว มี แนวโน้มที่จะก�ำจัดกลยุทธ์ที่ให้ผลตอบแทนต�่ำออกไป ตัวอย่างเช่น โบรกเกอร์ที่ท�ำได้ไม่ดีเท่าคู่แข่งก็ต้องเจ๊ง ไป ดังนั้นสูตรส�ำเร็จที่โบรกเกอร์ใช้นั้นก็ตกอยู่ใต้แรงกดดันทาง วิวัฒนาการลักษณะเดียวกันกับที่ยีนของปลาหรือแมลงต้องเจอ เพราะฉะนั้นมันก็ดูเข้าทีที่จะมองดุลยภาพแนชในเกมที่เล่นโดย โบรกเกอร์ แม้เราจะรู้ๆ กันอยู่ว่าโบรกเกอร์บางรายคงหาทางใน อ่างปลาทองไม่เจอ อย่าว่าแต่จะเข้าใจต�ำราทฤษฎีเกมเลย ทางแพร่งของนักโทษ เกมเด็กเล่นอันลือลัน่ ทีส่ ดุ คือเกมทางแพร่งของนักโทษ (Prisoner’s Dilemma) ตามท้องเรือ่ งดัง้ เดิมทีเ่ ป็นเหตุให้เกิดเกม
A
Very Short Introduction
41
นี้ขึ้น อลิซกับบ็อบคือสองนักเลงแห่งนครชิคาโกช่วงทศวรรษ 1920 อัยการเขตรู้ว่าทั้งสองมีความผิดฐานก่ออาชญากรรม ร้ายแรง แต่ไม่อาจพิสูจน์ได้เว้นแต่ว่าใครคนหนึ่งจะรับสารภาพ เขาสั่งจับอลิซและบ็อบรวมทั้งยื่นข้อเสนอให้กับแต่ละคนโดย แยกจากกันดังนี้ ถ้าคุณสารภาพแต่ผู้ร่วมกระท�ำผิดไม่รับสารภาพ คุณ จะได้รบั การปล่อยตัว ถ้าคุณไม่สารภาพแต่ผรู้ ว่ มกระท�ำผิด รับสารภาพ คุณจะถูกตัดสินว่ามีความผิดและรับโทษจ�ำคุก ในอัตราที่สูงที่สุด ถ้าพวกคุณทั้งสองคนสารภาพ คุณจะ ถูกตัดสินว่ามีความผิดแต่ไม่ต้องรับโทษจ�ำคุกอัตราสูงสุด ถ้าไม่มีใครรับสารภาพ คุณทั้งสองจะถูกใส่ความในคดี หลบเลี่ยงภาษีและจะถูกตัดสินว่ามีความผิดแน่นอน
เรือ่ งนีค้ งสะเทือนใจมากขึน้ ถ้าอลิซกับบ็อบตกลงกันว่า จะไม่ปริปากหากต้องเผชิญสถานการณ์ดงั กล่าว การท�ำอย่างนัน้ แสดงถึงการร่วมมือ ส่วนการรับสารภาพหมายถึงการหักหลัง ดังทีแ่ สดงในตารางทางด้านซ้ายของภาพประกอบ 7 ผลตอบแทน ในตารางแสดงถึงจ�ำนวนปีที่ต้องถูกจ�ำคุก (ภายใต้ข้อสมมติว่า 1 ยูทิลแสดงถึงระยะเวลาที่มีอิสรภาพเพิ่มขึ้น 1 ปี) เนื้อเรื่องที่ธรรมดากว่านั้นตั้งข้อสมมติว่าทั้งอลิซและ บ็อบสามารถเข้าถึงกล่องเงินกองกลางจ�ำนวนหนึ่ง ต่างคนต่าง ต้องเลือกว่าจะให้เงินที่อยู่ในกองกลางจ�ำนวน 2 ดอลลาร์กับ อีกฝ่าย หรือจะหยิบเงิน 1 ดอลลาร์จากกองกลางเก็บเข้ากระเป๋า
42
Game
หักหลัง
ร่วมมือ
พิราบ เหยี่ยว
หักหลัง
พิราบ
ร่วมมือ
เหยี่ยว เกมแบบนักเลง
Theory
เกมแบบให้-หรือ-เก็บ
ภาพประกอบ 7 เกมทางแพร่งของนักโทษ 2 รูปแบบ รูปแบบเกมทางด้าน ขวา พิราบ แสดงถึงการให้ และ เหยี่ยว แสดงถึงการเก็บ
ตัวเอง ภายใต้ขอ้ สมมติวา่ อลิซและบ็อบสนใจแต่เงินเท่านัน้ เราจะ ได้ตารางผลตอบแทนทางด้านขวาของภาพประกอบ 7 ซึ่งระดับ ยูทลิ ถูกก�ำหนดตามจ�ำนวนดอลลาร์ ในกรณีนเี้ ราจะเรียกกลยุทธ์ ที่หวังดีกับผู้อื่นด้วยการให้เงิน 2 ดอลลาร์ว่า พิราบ (dove) และ เรียกกลยุทธ์เห็นแก่ตวั ทีเ่ ก็บเงิน 1 ดอลลาร์เข้ากระเป๋าว่า เหยีย่ ว (Hawk) การวงกลมรอบการโต้ ต อบที่ ดี ที่ สุ ด เผยให้ เ ห็ น ว่ า ดุลยภาพแนชเพียงหนึ่งเดียวในเกมแบบให้-หรือ-เก็บ (give-ortake) ของเกมทางแพร่งของนักโทษนี้คือ ทั้งอลิซและบ็อบเล่น กลยุทธ์ เหยีย่ ว แม้วา่ แต่ละคนจะได้ผลตอบแทนมากขึน้ หากทัง้ คู่ เลือกเล่น พิราบ ส่วนเกมแบบนักเลงก็มีลักษณะเชิงกลยุทธ์ที่ เหมือนกัน ในดุลยภาพแนชเพียงหนึ่งเดียวของเกมนี้ แต่ละคน จะหักหลังกันซึ่งส่งผลให้ทั้งคู่ต้องอยู่ในคุกไปอีกนาน แม้ว่า แต่ละคนน่าจะได้รับโทษเบาลงมากหากร่วมมือกัน
A
Very Short Introduction
43
ความย้อนแย้งของความมีเหตุมีผลหรืออย่างไร? นั ก วิ ช าการทั้ ง หมดในยุ ค นั้ น ต้ อ งทนกล�้ ำ กลื น กั บ ค�ำกล่าวที่ว่า เกมทางแพร่งของนักโทษสะท้อนถึงแก่นปัญหา การร่วมมือกันของมนุษย์ ด้วยเหตุนี้พวกเขาจึงตั้งเป้าหมายอัน สิน้ หวังในการให้เหตุผลว่าท�ำไมค�ำตอบทีถ่ อื ว่าเป็น “ความย้อนแย้ง ของความมีเหตุมีผล” (paradox of rationality) ของทฤษฎีเกมนี้ ถึงไม่ถกู ต้อง (ดู บทที่ 10 เหตุผลวิบตั ใิ นเกมทางแพร่งของนักโทษ) แต่นักทฤษฎีเกมกลับคิดว่ามันผิดโดยสิ้นเชิงที่จะบอกว่าเกม ทางแพร่งของนักโทษสรุปเรื่องราวการร่วมมือกันของมนุษย์ ในทางตรงกันข้าม มันแสดงสถานการณ์ที่ลูกเต๋าถูกถ่วงน�้ำหนัก ให้โอกาสที่จะเกิดความร่วมมือกันเหลือน้อยที่สุดเท่าที่จะเป็นได้ ต่างหาก ถ้าเกมชีวติ อันยิง่ ใหญ่ทสี่ ายพันธุม์ นุษย์เล่นมีแบบจ�ำลอง เป็ น เกมทางแพร่ ง ของนั ก โทษได้ ข นาดนั้ น แล้ ว เราก็ ค งไม่ วิวฒ ั นาการมาเป็นสัตว์สงั คมอย่างนีห้ รอก! ดังนัน้ เราจึงไม่เห็นว่า การแก้โจทย์ความย้อนแย้งของความมีเหตุมีผลที่ถูกประดิษฐ์ ขึน้ มานีจ้ ะมีความจ�ำเป็นมากกว่าการอธิบายว่าท�ำไมคนถึงจมน�ำ้ เมื่ อ ถู ก โยนลงทะเลสาบมิ ชิ แ กนโดยที่ เ ท้ า โดนหล่ อ กั บ แท่ ง คอนกรีต ความย้อนแย้งของความมีเหตุมผี ลนัน้ ไม่มอี ยูจ่ ริง ผูเ้ ล่น ที่มีเหตุมีผลตัดสินใจไม่ร่วมมือกันในเกมทางแพร่งของนักโทษ ก็เพราะเงื่อนไขที่จ�ำเป็นต่อการร่วมมือกันอย่างมีเหตุมีผลนั้น ขาดหายไป โชคดี ที่ ยุ ค แห่ ง ความย้ อ นแย้ ง ของความมี เ หตุ มี ผ ล
44
Game
Theory
ในประวัติศาสตร์ทฤษฎีเกมก�ำลังจะสิ้นสุดลงพอดี มันจะได้รับ การจดจ�ำว่าเป็นช่วงเวลาที่บรรดาเหตุผลวิบัติทั้งหลายที่ถูก ประดิษฐ์ขึ้นจากความพยายามอันสิ้นหวังเพียงเพื่อจะพิสูจน์ว่า มันมีเหตุมีผลที่ผู้เล่นจะร่วมมือกันในเกมทางแพร่งของนักโทษ ในปัจจุบันเหตุผลวิบัติเหล่านั้นถูกอ้างถึงเพื่อเป็นตัวอย่างชวน ขบขันของสิ่งที่นักจิตวิทยาเรียกว่าการให้เหตุผลวิเศษ (magical reasoning) ที่ตรรกะถูกบิดเบือนเพื่อให้ได้มาซึ่งผลสรุปตาม ต้องการ ตัวอย่างทีผ่ มชอบมากคือค�ำกล่าวของ อิมมานูเอล คานต์ (Immanuel Kant) ทีว่ า่ ความมีเหตุมผี ลคือการปฏิบตั ติ วั ตามกฎ ค�ำสั่งเด็ดขาด (categorical imperative)i ของเขา ดังนั้นในเกม ทางแพร่งของนักโทษ ผู้เล่นที่มีเหตุมีผลล้วนจะเลือก พิราบ เพราะนี่เป็นกลยุทธ์ที่ดีที่สุดถ้าทุกคนเลือกมัน การครอบง�ำ แนวคิ ด ที่ ว ่ า การท� ำ สิ่ ง ใดก็ ต ามที่ ห ากทุ ก คนท� ำ แบบ เดียวกันแล้วจะเกิดผลเสียคือสิง่ ทีไ่ ร้เหตุไร้ผลอย่างชัดเจน ได้รบั การยอมรับแพร่หลาย แม่ของคุณอาจชอบพอมันมากพอๆ กับ แม่ของผม ด้วยเหตุนี้ เหตุผลหักล้างที่หนักแน่นในกรณีของเกม กฎค�ำสั่งเด็ดขาด คือค�ำที่ อิมมานูเอล คานต์ ใช้แสดงถึงหน้าที่ทางศีลธรรมที่ ถูกต้องหรือค�ำสัง่ ปราศจากเงือ่ นไข ซึง่ เป็นสากลและไม่ขนึ้ อยูก่ บั ความต้องการ หรือแรงจูงใจใดๆ ของปัจเจกบุคคล เป็นสิ่งที่ทุกคนเห็นตรงกันว่าควรกระท�ำ โดยตัวมันเอง ไม่ใช่ควรท�ำเพื่อบรรลุสิ่งอื่นใด - เชิงอรรถทั้งหมดในหนังสือ เล่มนี้จัดท�ำโดยผู้แปล i
A
Very Short Introduction
45
ทางแพร่งของนักโทษต่อไปนี้สมควรถูกหยิบยกขึ้นมาอีกครั้ง เพื่อไม่ให้เป็นการสรุปอะไรไปล่วงหน้า เราจะเริ่มด้วย การถามว่า ผลตอบแทนที่สะท้อนความพึงใจของผู้เล่นในเกม ทางแพร่งของนักโทษนัน้ มาจากไหน ทฤษฎีความพึงใจทีเ่ ปิดเผย บอกให้เราหาค�ำตอบจากการสังเกตสิง่ ทีอ่ ลิซและบ็อบเลือก (หรือ น่าจะเลือก) ตอนที่พวกเขาแก้ปัญหาการตัดสินใจเพียงล�ำพัง (one-person decision problem) ดั ง นั้ น การเขี ย นผลตอบแทนส� ำ หรั บ อลิ ซ ในช่ อ ง ล่างซ้ายของตารางผลตอบแทนในเกมทางแพร่งของนักโทษ ให้มากกว่าช่องบนซ้ายนัน้ หมายความว่าอลิซจะเลือกเล่น เหยีย่ ว ในปั ญ หาการตั ด สิ น ใจเพี ย งล� ำ พั ง ที่ เ ธออาจต้ อ งเจอถ้ า เธอรู ้ ล่วงหน้าว่าบ็อบจะเลือก พิราบ ในท�ำนองเดียวกัน การเขียน ผลตอบแทนในช่องล่างขวาให้มากกว่า (เมือ่ เทียบกับช่องบนขวา) ก็หมายความว่าอลิซจะเลือก เหยีย่ ว เมือ่ ต้องเผชิญกับปัญหาการ ตัดสินใจเพียงล�ำพัง ซึ่งเธอรู้ล่วงหน้าแล้วว่าบ็อบเลือก เหยี่ยว ดังนั้นแก่นนิยามของเกมจึงกล่าวว่า เหยี่ยว คือการ โต้ตอบที่ดีที่สุดของอลิซถ้าเธอรู้ว่ากลยุทธ์ที่บ็อบเลือกคือ พิราบ รวมถึงตอนที่เธอรู้ว่าเขาเลือก เหยี่ยว ด้วยเช่นกัน เพราะฉะนั้น อลิซรู้ว่าการโต้ตอบที่ดีที่สุดของเธอต่อกลยุทธ์ของบ็อบคืออะไร โดยที่เธอไม่จ�ำเป็นต้องรู้เลยว่าจริงๆ แล้วเขาเลือกอะไร มันมี เหตุมผี ลส�ำหรับเธอทีจ่ ะเลือก เหยีย่ ว ไม่วา่ กลยุทธ์ทเี่ ขาวางแผน จะเล่นคืออะไรก็ตาม ในสถานการณ์ผิดธรรมดาเช่นนี้ กล่าวได้ ว่ากลยุทธ์ เหยี่ยว ครอบง�ำทางเลือกเชิงกลยุทธ์อื่นๆ ของอลิซ ทั้งหมด
46
Game
Theory
แล้วข้อโต้แย้งล่ะ? มีข้อโต้แย้งสามัญ 2 ประการต่อการวิเคราะห์ข้างต้น ข้อโต้แย้งแรกนั้นไม่เห็นด้วยว่าอลิซจะเลือกหักหลังหากเธอรู้ว่า บ็อบได้เลือกทีจ่ ะร่วมมือในเกมทางแพร่งของนักโทษแบบนักเลง เหตุผลหลายหลากถูกน�ำมาใช้สนับสนุนสุดแท้แต่ความเชื่อของ แต่ละคนที่มีต่อสภาพของนครชิคาโกภายใต้อิทธิพลของเจ้าพ่อ อัล คาโปน (Al Capone) แต่การโต้แย้งแบบนีน้ นั้ หลงประเด็น หาก อลิซไม่หักหลังเมื่อเธอรู้ว่าบ็อบเลือกที่จะร่วมมือแล้ว ก็แสดงว่า เธอไม่ได้ก�ำลังเล่นเกมทางแพร่งของนักโทษอยู่ สิ่งส�ำคัญคือเรา จะต้องไม่จริงจังกับเรือ่ งราวต่างๆ ทีข่ บั เคลือ่ นตัวเกมมากจนเกิน ไปทัง้ ในเกมนีแ้ ละเกมอืน่ ๆ สิง่ ทีน่ ยิ ามเกมทางแพร่งของนักโทษ คือตารางผลตอบแทนตามภาพประกอบ 7 หาใช่เรือ่ งราวไร้สาระ ที่มากับมันไม่ ข้อโต้แย้งที่สองมักท�ำให้ผมฉงนอยู่เสมอ ข้อโต้แย้งนี้ กล่าวว่า การยึดกับทฤษฎีความพึงใจที่เปิดเผยท�ำให้การอ้างว่า การหักหลังนั้นมีเหตุมีผลในเกมทางแพร่งของนักโทษ ถูกลด รูปเป็นเพียงสัจนิรันดร์ (tautology) ซึ่งเป็นจริงเสมอ และเมื่อ สัจนิรันดร์นั้นปราศจากเนื้อหาสาระใดๆ เราจึงไม่ต้องสนใจการ กล่าวอ้างดังกล่าว! แต่จะมีใครกล้าพูดแบบเดียวกันนี้กับสมการ 2 + 2 = 4 บ้างล่ะ?
A
Very Short Introduction
47
การทดลอง การตอบโต้อีกแบบหนึ่งคือการแย้งว่าความมีเหตุมีผล ในเกมทางแพร่งของนักโทษจะเป็นอะไรไม่ส�ำคัญ เพราะผลการ ทดลองในห้องปฏิบัติการแสดงให้เห็นว่าในความเป็นจริงผู้คน ตัวเป็นๆ เล่นกลยุทธ์ พิราบ แต่ผลตอบแทนในการทดลองเหล่านัน้ มักจะไม่ได้ถกู ก�ำหนดโดยทฤษฎีความพึงใจทีเ่ ปิดเผย และเกือบ ทัง้ หมดเป็นเพียงผลตอบแทนทีเ่ ป็นตัวเงิน กระนัน้ ผลการทดลอง เหล่านี้ก็อธิบายอะไรได้หลายอย่าง กลุ่มตัวอย่างที่ขาดประสบการณ์นั้นเลือกที่จะร่วมมือ จริง โดยมีจ�ำนวนมากกว่าครึ่งของจ�ำนวนครั้งที่ทดลองเล็กน้อย แต่ก็มีหลักฐานมากมายที่ได้จากการทดลองเกมอย่างทางแพร่ง ของนักโทษ โดยแสดงให้เห็นว่าอัตราการหักหลังนัน้ เพิม่ ขึน้ อย่าง ต่อเนื่องเมื่อกลุ่มตัวอย่างมีประสบการณ์กับเกมมากยิ่งขึ้น โดย เหลือกลุ่มตัวอย่างเพียงประมาณ 10% ที่ยังคงเลือกจะร่วมมือ หลังจากการทดลองผ่านไปประมาณ 10 รอบ การจ�ำลองผล (simulation) ด้วยคอมพิวเตอร์ก็ถูกน�ำ มาใช้เพื่อแสดงว่า ในท้ายที่สุดแล้ววิวัฒนาการจะก่อให้เกิดการ ร่วมมือในเกมทางแพร่งของนักโทษ แต่ผวู้ จิ ารณ์เหล่านีม้ กั สับสน เกมทางแพร่งของนักโทษกับเกมลูกพีล่ กู น้องของมันทีม่ กี ารเล่น ซ�ำ้ ไม่สนิ้ สุด (infinitely repeated) ซึง่ การร่วมมือคือดุลยภาพแนช จริงๆ (ดู ตาต่อตา-ฟันต่อฟัน บทที่ 5)