Weapons of Math Destruction เมื่อตัวเลขก่อความเสียหายด้วยอคติของมนุษย์

สฤณี อาชวานันทกุล เรื่อง

ในยุคที่คำว่า big data, open data, data journalism, AI, blockchain, FinTech และอื่นๆ อีกมากมายที่แวดล้อมคำว่า “ข้อมูล” กำลังฮอตฮิตติดหูคนไทย หลายคนมองว่าสิ่งเหล่านี้จะนำเราเข้าสู่ยุคพระศรีอาริย์โดยอัตโนมัติ ผู้เขียนเห็นว่าน่าจะได้เวลาเตือนสติกันหน่อยว่า “ด้านมืด” ที่เราต้องระวังมีอะไรบ้าง

ในปี พ.ศ. 2559 แคธี โอนีล (Cathy O’Neil) นักคณิตศาสตร์ดีกรีปริญญาเอกจากมหาวิทยาลัยฮาร์วาร์ด อดีตนักปั้นแบบจำลองทางคณิตศาสตร์ (ชื่อเล่น “คว้อนท์” หรือ quant ย่อมาจาก quantitative analyst) ให้กับเฮดจ์ฟันด์ยักษ์ใหญ่ในภาคการเงินสหรัฐ เขียนหนังสือที่ผู้เขียนชอบมากเล่มหนึ่ง ชื่อ Weapons of Math Destruction หรือ “คณิตศาสตร์อานุภาพทำลายล้างสูง”

โอนีลเขียนหนังสือเล่มนี้ขึ้นมาไม่ใช่เพราะเธอเกลียดเทคโนโลยี หรือคิดว่าแบบจำลองทางคณิตศาสตร์ (mathematical models) ทั้งหลายในโลกจริงไร้ประโยชน์ ตรงกันข้าม เธอเชื่อมั่นใน “พลัง” ของแบบจำลอง โดยเฉพาะแบบจำลองที่มีข้อมูลจริงมหาศาล ขนาด “บิ๊กดาต้า” (big data) มาประกอบการประมวลผลเพื่อสร้างประโยชน์แก่สังคม

แต่เธอเขียนหนังสือเล่มนี้เพื่อชี้ให้เห็นปัญหาและความเสียหายร้ายแรงที่เกิดขึ้นแล้วจากแบบจำลองแย่ๆ ซึ่งโอนีลขนานนามว่า “คณิตศาสตร์อานุภาพทำลายล้างสูง”

เราอาจเข้าใจผิดว่า แบบจำลองหรือ model ย่อมเป็น “ภววิสัย” (objective) เพราะเขียนขึ้นจากหลักคณิตศาสตร์ และใช้คอมพิวเตอร์ประมวลผล ฉะนั้นผลลัพธ์ต้องออกมาเป็นกลาง ไร้ซึ่งอคติใดๆ ของมนุษย์แน่เลย

แต่โอนีลเตือนว่าไม่ใช่! เพราะ “แบบจำลอง คือ ความเห็นที่ฝังอยู่ในคณิตศาสตร์” (models are opinions embedded in mathematics) ต่างหาก พูดอีกอย่างคือ สมมติฐาน ตัวแปร สมการ และโค้ดทุกบรรทัดในแบบจำลองทุกชิ้นมีมนุษย์อยู่เบื้องหลัง

ในเมื่อเป็นความเห็นที่อำพรางอยู่เบื้องหลังสมการคณิตศาสตร์ จึงอาจเต็มไปด้วยอคติ (ทั้งในความหมาย prejudice และ preconception) ความลำเอียง จุดอ่อน หรือจุดบอดอื่นๆ ของมนุษย์ผู้เขียนแบบจำลอง รวมถึงบางคนอาจไม่เข้าใจในหลักสถิติพื้นฐานด้วย

โอนีลนิยาม “คณิตศาสตร์อานุภาพทำลายล้างสูง” ว่า หมายถึง อัลกอริธึมคณิตศาสตร์ (mathematical algorithm) อะไรก็ตามที่มีลักษณะครบทั้งสามข้อต่อไปนี้

1. คนส่วนใหญ่มองเห็นด้วยความคลุมเครือ หรือมองไม่เห็นเลย ไม่รู้ว่ามันทำงานอย่างไร ผลลัพธ์ของแบบจำลองนี้คำนวณออกมาอย่างไร

2. ไม่เป็นธรรม และสร้างความเสียหายสูงมากต่อชีวิตความเป็นอยู่ของผู้คน

3. ขยายขนาดได้ (scalable) นั่นคือ เอาไปใช้ได้กับคนอีกหลายพันหรือหลายล้านคน

“คณิตศาสตร์อานุภาพทำลายล้างสูง” มักจะเกิดจากการใช้เหตุผลที่ขี้เกียจหรือเต็มไปด้วยอคติ และผลลัพธ์ของมันก็มักจะสร้าง “วงจรย้อนกลับ” (feedback loops) ที่ส่งผลเสียมากกว่าเดิม เมื่อคนที่เกี่ยวข้องถูกกดดันให้ปรับเปลี่ยนพฤติกรรม

โอนีลยกตัวอย่างมากมายในหนังสือ สองตัวอย่างที่ผู้เขียนชอบมากมาจากวงการการศึกษา และกระบวนการยุติธรรมสหรัฐ

การจัดอันดับวิทยาลัยและมหาวิทยาลัยที่ “ดีที่สุด” ทั่วโลก ของ U.S. News and World Report วันนี้กลายเป็น “มาตรฐานทองคำ” และตัวชี้วัดผลงานของผู้บริหารสถาบันการศึกษาทั่วโลก โอนีลบอกว่าการจัดอันดับชุดนี้เข้าข่าย “คณิตศาสตร์อานุภาพทำลายล้างสูง” ในนิยามของเธอ เพราะมันไม่สนใจ “ค่าใช้จ่าย” (ของนักศึกษาและผู้ปกครอง) ในการจัดอันดับเลย ส่งผลให้ค่าเล่าเรียนระดับอุดมศึกษาแพงขึ้นอย่างต่อเนื่อง เพราะมหาวิทยาลัยสามารถทุ่มเงินเพื่อไต่อันดับสูงๆ ได้ โดยไม่ต้องสนใจที่จะควบคุมค่าใช้จ่ายเพื่อแบ่งเบาภาระของนักศึกษา หรือปรับปรุงประสิทธิภาพการใช้ทรัพยากรแต่อย่างใด

นอกจากนี้ ตัวชี้วัด “ระดับการเข้ายาก/ง่าย” (selectivity – ยิ่งมหาวิทยาลัย “เข้ายาก” เช่น รับนักศึกษาเพียงร้อยละ 8 ของจำนวนทั้งหมดที่สมัคร อันดับยิ่งดี) ก็กดดันให้มหาวิทยาลัยต่างๆ แข่งกันทำการตลาด ดึงดูดให้นักเรียนสมัครมาเยอะๆ แล้วจากนั้นก็ต้องตอบปฏิเสธไปเยอะๆ เช่นกัน เพื่อเพิ่มคะแนน “การเข้ายาก” ให้สูงขึ้น ทั้งที่กิจกรรมเหล่านี้อาจไม่เกี่ยวอะไรเลยกับ “คุณภาพ” ของการศึกษา

การที่ “ระดับความเข้ายาก” (selectivity) เป็นเกณฑ์สำคัญข้อหนึ่งในคะแนน ส่งผลให้ความคิดเรื่อง “มหาวิทยาลัยสำรอง” หรือ safety school (หมายถึงมหาวิทยาลัยที่เราสมัครเพราะมั่นใจว่า “เข้าได้แน่นอน”) แทบจะหมดความหมายไปอย่างสิ้นเชิง เพราะมหาวิทยาลัยที่เข้าง่ายก็อยากตอบปฏิเสธนักศึกษาเกรดดีที่ตัวเองค่อนข้างมั่นใจว่า “ไม่ตัดสินใจมาเรียนกับเราหรอก เพราะน่าจะติดที่อื่น” เพราะอัตราการตอบปฏิเสธสูงๆ ส่งผลให้คะแนน “ระดับความเข้ายาก” ดีขึ้น

ในทางกลับกัน มหาวิทยาลัยที่เข้ายากมากทั้งหลายก็จะถูกตัวชี้วัดเดียวกันกดดันให้รักษาหรือเพิ่มอัตราการปฏิเสธต่อไป ทั้งหมดนี้ส่งผลให้เด็กเรียนดีหรือเรียนกลางๆ จำนวนมากพบว่าตัวเองไม่มีที่ไป – มหาวิทยาลัยที่เข้ายากสำหรับพวกเขาตอบปฏิเสธ ส่วนมหาวิทยาลัยที่คิดว่าเข้าง่ายก็ตอบปฏิเสธมาเช่นกัน!

นอกจากเกณฑ์การจัดอันดับมหาวิทยาลัยจะมีปัญหาแล้ว โอนีลชี้ว่าระบบการประเมิน “ผลงาน” ของครูโรงเรียนรัฐระดับประถมศึกษาและมัธยมศึกษาในสหรัฐอเมริกาก็มีปัญหา ซึ่งเธอมองว่าเข้าข่าย WMD ไม่ยิ่งหย่อนไปกว่ากัน

ระบบประเมินครูในโรงเรียนรัฐของอเมริกาตั้งอยู่บนสมมติฐานว่า ครูที่ “ดี” คือ ครูที่นักเรียนของตนสามารถทำคะแนนสอบมาตรฐานได้ดีขึ้น คะแนนสอบยิ่งดีขึ้นเรื่อยๆ ยิ่งแปลว่าครูคนนั้นเก่งในทัศนะของระบบประเมิน แน่นอน ในเมื่อระบบเป็นแบบนี้ ครูหลายคนก็มีแรงจูงใจที่จะ “โกง” เช่น บอกข้อสอบนักเรียนก่อนสอบ หรือแก้คำตอบที่ผิดให้เป็นคำตอบที่ถูก

ปัญหาที่ตามมาคือ ถ้าหากครูที่โกงระบบลอยนวลไปได้เรื่อยๆ ไม่มีใครจับได้ว่าโกง คนที่จะเดือดร้อนที่สุดก็คือครูผู้ซื่อสัตย์ทั้งหลาย เพราะนักเรียนของเขาหรือเธอย่อมไม่อาจแสดง “การปรับปรุง” ในแง่คะแนนสอบของนักเรียนได้มากกว่าคะแนน “เหนือจริง” ของนักเรียนในห้องครูขี้โกง ส่งผลให้ครูดีๆ ที่มีศักยภาพสูงและเป็นที่รักของนักเรียนต้องถูกไล่ออกเพราะระบบประเมินจัดชั้นเป็น “ครูที่มีผลงานแย่” ในขณะที่ครูขี้โกงกลับได้เลื่อนขั้น

โอนีลชี้ว่า ต่อให้ไม่มีครูคนไหนอยากโกงเลย ระบบประเมินที่หมกมุ่นกับคะแนนสอบแบบนี้ย่อมแปลว่า ครูที่ “ดีที่สุด” ในระบบนี้คือครูที่ไม่ทำอะไรเลยยกเว้น “สอนเพื่อสอบ” อะไรก็ตามที่อยู่นอกเหนือกระบวนการสอบถือว่าเป็นส่วนเกินและไม่จำเป็น ต่อให้มันสำคัญสำหรับการเรียนรู้ของนักเรียน

ถ้าแบบจำลองให้ผลลัพธ์ที่เข้าใจไม่ได้ ไม่ต่างกันมากกับการสุ่มเลือกตัวเลขออกมา ตัวเลขคะแนนสูงๆ จากแบบจำลองนี้ย่อมไม่อาจสะท้อน “ครูที่ดี” ได้ และในทางกลับกัน ครูที่ได้ตัวเลขต่ำๆ ก็อาจไม่ “แย่” อย่างที่แบบจำลองยัดเยียดให้ก็ได้ ปัญหาคือตัวเลขคะแนนนี้ถูกนำไปใช้จริงในการประเมินครู เลื่อนชั้นครูที่ “ดี” และไล่ออกครูที่ “ไม่ดี” เพราะ “คนเรามักจะเชื่อมั่นในตัวเลข” ในความเห็นของโอนีล

เมื่อหันมามองนอกระบบการศึกษา ระบบยุติธรรมในสหรัฐอเมริกาก็เป็นอีกวงการที่ประสบภัยจากแบบจำลองอานุภาพทำลายล้างสูง ปัจจุบันศาลใน 24 มลรัฐ (จากทั้งหมด 50 มลรัฐ) ในอเมริกาใช้แบบจำลองการทำผิดซ้ำ (recidivism model) ซึ่งเป็นแบบจำลองทางคณิตศาสตร์ ในการพิจารณาความเป็นไปได้ที่อาชญากรผู้ต้องโทษจำคุกจะกลับไปทำผิดซ้ำอีก หลังจากที่พ้นโทษออกไปแล้ว

ศาลหลายแห่งใน 24 มลรัฐใช้ผลลัพธ์การคาดการณ์จากแบบจำลองนี้ในการกำหนดโทษ ฉะนั้นจึงส่งผลต่อชีวิตของคนจำนวนมากที่เดินเข้าเรือนจำ

ถึงแม้ว่าแบบจำลองนี้โดยรวมจะทำให้การกำหนดโทษของผู้พิพากษามีความ ‘สม่ำเสมอ’ มากกว่าที่แล้วมา (ไม่ต้องมาตั้งข้อสังเกตกันว่า ผู้พิพากษาคนไหน ‘ลำเอียง’ หรือไม่เพียงใด) โอนีลชี้ว่าบ่อยครั้งมันก็อำพรางอคติและสมมติฐานที่ผิดและอันตรายไว้เบื้องหลังเทคโนโลยีสวยหรูดูดี

ดังตัวอย่างแบบจำลองที่เรียกว่า Level of Service Inventory—Revised หรือย่อว่า LSI-R

หัวใจของแบบจำลองชนิดนี้คือการให้นักโทษตอบแบบสอบถามขนาดยาว คำตอบของคำถามบางข้อ เช่น “ก่อนหน้าที่จะรับโทษครั้งนี้ คุณต้องโทษจำคุกมาแล้วกี่ครั้ง” “คนอื่นมีส่วนรู้เห็นเป็นใจในการก่ออาชญากรรมอย่างไร” และ “ยาเสพติดและสุรามีส่วนในการก่ออาชญากรรมของคุณหรือไม่ อย่างไร” ถูกให้น้ำหนักมากในการคำนวณโอกาสที่นักโทษจะออกไปทำผิดซ้ำ

ปัญหาที่เกิดขึ้นคือ เมื่อไล่อ่านคำถามต่างๆ ในแบบสอบถามนี้ ซึ่งล้วงลึกลงไปในรายละเอียดการใช้ชีวิต เราก็จินตนาการได้อย่างง่ายดายว่า นักโทษที่มาจากครอบครัวฐานะดีจะตอบคำถามแบบหนึ่ง นักโทษที่มาจากสลัมหรือละแวกยากจนจะตอบอีกแบบ ยกตัวอย่างเช่น นักโทษที่มาจากครอบครัวแถบชานเมืองที่มีชีวิตราบรื่นอาจตอบคำถาม “ครั้งแรกที่คุณข้องแวะกับตำรวจคือเมื่อไร” ว่า ไม่เคยถูกตำรวจจับเลยจนกระทั่งถึงคดีที่ทำให้เขาต้องมาอยู่ในคุก ในทางตรงกันข้าม นักโทษที่เป็นชายหนุ่มผิวดำน่าจะเคยถูกตำรวจหยุดและสั่งค้นตัวหลายสิบรอบก่อนจะถึงคดีที่ต้องโทษ ถึงแม้พวกเขาจะไม่เคยทำอะไรผิด เนื่องจากเป็นกลุ่มที่ถูกตำรวจเพ่งเล็งอยู่แล้ว (อคติของตำรวจผิวขาวจำนวนมากต่อคนผิวดำ เป็นปัญหาการเหยียดผิวที่ยังแก้ไม่ตกในหลายมลรัฐในอเมริกาสืบมาจนปัจจุบัน และมีส่วนเป็นชนวนให้เกิดเหตุประท้วงและจลาจลหลายครั้งในรอบหลายปีที่ผ่านมา)

ผลการศึกษาปี 2013 ของ New York Civil Liberties Union องค์กรที่ทำงานด้านสิทธิพลเมือง พบว่าถึงแม้ผู้ชายผิวดำและผู้ชายเชื้อสายลาติน (พื้นเพจากอเมริกาใต้) วัย 14-24 ปี มีสัดส่วนเพียงร้อยละ 4.7 ของประชากรในกรุงนิวยอร์ก พวกเขากลับถูกตำรวจเรียกหยุดเพื่อตรวจค้นตัวสูงถึงร้อยละ 40.6 ของการสั่งหยุดตรวจค้นทั้งหมด ในจำนวนนี้มากกว่าร้อยละ 90 ของคนที่ถูกสั่งตรวจเป็นผู้บริสุทธิ์ ไม่ได้พกสิ่งผิดกฎหมายใดๆ เลย ขณะที่คนอื่นอาจถูกจับในข้อหาดื่มสุราทั้งที่อายุไม่ถึง หรือพกกัญชาติดตัว ซึ่งก็เป็นสิ่งเดียวกันกับที่ลูกคนรวยผิวขาวหลายคนทำ แต่ไม่เคยถูกจับเพราะตำรวจแทบไม่เคยสั่งค้นตัว

ด้วยเหตุนี้ ถ้าหาก “การข้องแวะ” กับตำรวจตั้งแต่อายุยังน้อยเป็นตัวแปรที่แบบจำลองนี้มองว่าเป็นสัญญาณบ่งชี้แนวโน้มที่จะกระทำผิดซ้ำ คนจนและคนผิวสีที่เป็นชนกลุ่มน้อยก็จะดู “มีความเสี่ยง” จากแบบจำลองนี้สูงกว่าคนผิวขาวและคนรวยมาก

คำถามในแบบสอบถามที่เอาไปใช้คำนวณไม่ได้หยุดเพียงเท่านั้น นักโทษถูกถามด้วยว่า เพื่อนและญาติของพวกเขามีประวัติอาชญากรหรือไม่ และก็อีกเช่นกันที่นักโทษจากครอบครัวชนชั้นกลางในเมืองจะมีแนวโน้มสูงกว่าคนจนที่จะตอบว่า “ไม่มี”

แบบสอบถามสำหรับ LSI-R ไม่ถามว่า “คุณมีสีผิวอะไร” ตรงๆ เพราะผิดกฎหมายอเมริกา แต่ข้อมูลมโหฬารที่นักโทษแต่ละคนต้องตอบก็ทำให้คำถามข้อนี้ไม่จำเป็นต้องถามเลย!

แบบจำลอง LSI-R ถูกคิดค้นและใช้จริงมาตั้งแต่ปี ค.ศ. 1995 และแบบสอบถามนักโทษที่เอาไปคำนวณก็มีนักโทษตอบไปแล้วหลายพันคน นักสถิติใช้ผลแบบสอบถามในการออกแบบระบบที่ให้ ‘คะแนน’ คำตอบที่ถูกมองว่าเชื่อมโยงกับการกระทำผิดซ้ำ สูงกว่าคำตอบที่ถูกมองว่าไม่เชื่อมโยงเท่าไร หลังจากที่ตอบแบบสอบถามแล้ว คะแนนของนักโทษแต่ละคนจะถูกนำมาจัดหมวดหมู่เป็น “ความเสี่ยงสูง” “ความเสี่ยงปานกลาง” และ “ความเสี่ยงต่ำ” (ที่จะกระทำผิดซ้ำหลังพ้นโทษ)

ในบางมลรัฐอย่างเช่นโรดไอส์แลนด์ แบบทดสอบนี้ถูกใช้เพียงเพื่อหาตัวกลุ่มเป้าหมาย (คนที่เข้าข่าย “ความเสี่ยงสูง”) มาเข้าโครงการป้องกันการกระทำผิดซ้ำ แต่ในบางมลรัฐอย่างเช่น ไอดาโฮ และโคโลราโด ผู้พิพากษาใช้คะแนนจากแบบจำลองนี้เป็นส่วนหนึ่งในการพิจารณากำหนดโทษ!

ส่งผลให้คนผิวสีที่ยากจนมีแนวโน้มที่จะต้องโทษจำคุกหนักกว่าคนผิวขาวที่ร่ำรวยหลายเท่า

หลักการสำคัญประการหนึ่งของระบบยุติธรรมทุกแห่ง คือ เราทุกคนถูกตัดสินจากสิ่งที่เราลงมือทำ ไม่ใช่คนที่เราเป็น แต่แบบจำลอง LSI-R ไม่เพียงแต่ละเมิดหลักการนี้ แต่ยังละเมิดในทางที่ซ้ำเติมคนอีกด้วย

นักโทษที่ถูกให้คะแนน “ความเสี่ยงสูง” มีแนวโน้มมากกว่าคนอื่นที่จะมาจากถิ่นยากจนและไม่มีงานทำ เมื่อเขาถูกจัดเข้าหมวดหมู่นี้ ก็จะรับโทษในคุกนานกว่าคนอื่น ถูกแวดล้อมด้วยอาชญากรคนอื่นๆ เพิ่มความเสี่ยงที่จะออกไปกระทำผิดซ้ำ และกลับเข้าคุกมาอีก ซึ่งก็จะกลายเป็นว่าเป็นเครื่องพิสูจน์ “ความสำเร็จ” ของแบบจำลอง (ว่ามันคาดการณ์ถูกว่าคนคนนี้จะทำผิดซ้ำ)

ทั้งที่แบบจำลองเองนั่นแหละที่มีส่วนสร้างวงจรอุบาทว์!

หมายเหตุ: บทความนี้เรียบเรียงจากซีรีส์บทความซึ่งเคยตีพิมพ์ครั้งแรกบนเว็บไซต์ไทยพับลิก้า และหนังสือพิมพ์กรุงเทพธุรกิจ ปี พ.ศ. 2559

ระเบียบวิธีวิจัย Weapons of Math Destruction โมเดลคณิตศาสตร์ คณิตศาสตร์ สฤณี อาชวานันทกุล

เรื่อง: สฤณี อาชวานันทกุล

กรรมการผู้จัดการด้านการพัฒนาความรู้ แห่ง “ป่าสาละ” บริษัทปลูกธุรกิจยั่งยืนแห่งแรกของประเทศไทย ผู้ร่วมก่อตั้งสำนักพิมพ์ openworlds สฤณีเป็นนักเขียน นักแปล และนักอ่าน มีผลงานตีพิมพ์มากกว่า 50 เล่ม โดยเฉพาะหนังสือด้านเศรษฐกิจการเมือง และธุรกิจยั่งยืน

Weapons of Math Destruction เมื่อตัวเลขก่อความเสียหายด้วยอคติของมนุษย์

เรื่อง: สฤณี อาชวานันทกุล

MOST READ

มือที่มองไม่เห็นของ อดัม สมิธ: คำถามใหญ่ว่าด้วย ‘ธรรมชาติของมนุษย์’

อั๊บ สิร นุกูลกิจ

Marxism ตายแล้ว? : เราจะคืนชีพใหม่ให้ ‘มาร์กซ์’ ในศตวรรษที่ 21 ได้หรือไม่?

ณรจญา ตัญจพัฒน์กุล

การท่องเที่ยวกับเศรษฐกิจไทย

พิพัฒน์ เหลืองนฤมิตชัย

เรื่อง: สฤณี อาชวานันทกุล

RELATED POSTS

MOST READ

อั๊บ สิร นุกูลกิจ

ณรจญา ตัญจพัฒน์กุล

พิพัฒน์ เหลืองนฤมิตชัย

พลังความรู้และความคิดสร้างสรรค์ เป็นฐานสำคัญในการเปลี่ยนแปลงสังคมให้ดีขึ้น

เต็มที่กับบทความและสื่อสร้างสรรค์ที่จัดมาให้แบบรู้ใจที่สุด

บันทึกเนื้อหาไว้อ่านในภายหลัง

อ่าน 101 ในแบบที่คุณชื่นชอบ

เข้าสู่ระบบด้วยอีเมล

สมัครสมาชิก

สมัครสมาชิกเรียบร้อยแล้ว

ลืมรหัสผ่าน

เข้าสู่ระบบด้วย

พลังความรู้และความคิดสร้างสรรค์
เป็นฐานสำคัญในการเปลี่ยนแปลงสังคมให้ดีขึ้น