ทำไม Generative AI จึง ‘ทำนาย’ เก่งกว่า AI แบบอื่นๆ

เมื่อ ChatGPT เปิดตัวปลายปี 2022 โลกของเราได้เปลี่ยนแปลงไปตลอดกาล นักวิเคราะห์บางคนเรียกปรากฏการณ์นี้ว่าเป็น ‘การพบปะครั้งที่สอง’ ระหว่างมนุษย์กับ AI (Second Contact of Humanity with AI) หลังจากการพบปะครั้งแรกกับอัลกอริทึมที่ใช้คัดสรรข้อมูลบนสื่อสังคมออนไลน์ คอยแนะนำข้อความ วิดีโอ และโฆษณาอย่างเงียบๆ อยู่เบื้องหลัง แต่เวลานี้ AI อย่าง Generative AI กลับมาปรากฏตัวเป็นคู่สนทนากึ่งมนุษย์อยู่เบื้องหน้า สามารถสร้างบทกวี เขียนโปรแกรม หรือเป็นเพื่อนคู่คิดของมนุษย์ได้อย่างน่าทึ่ง

การพบปะครั้งที่สองระหว่างมนุษย์กับ AI นี้อาจดูยิ่งใหญ่กว่าครั้งแรก คนทั่วไปอาจรู้สึกว่า ChatGPT, Claude หรือ Gemini มีความเหนือชั้นกว่าระบบแนะนำสินค้าอัตโนมัติของ Amazon หรืออัลกอริทึมที่ใช้คัดสรรข้อมูลข่าวสารบนสื่อสังคมออนไลน์ แต่ในความจริงแล้ว ทั้งหมดล้วนมีแก่นเดียวคือเป็น ‘เครื่องจักรแห่งการทำนาย’ (Prediction Machine) ทั้งสิ้น

อย่างไรก็ตาม Generative AI และ Predictive AI ก็ยังมีความแตกต่างกันอยู่ โดยสามารถอธิบายได้ด้วย Unified Theory of Prediction ที่จะถูกนำเสนอในบทความนี้ ซึ่งเป็นการควบรวมหลากหลายศาสตร์เข้าด้วยกัน ทั้งวิทยาการคอมพิวเตอร์ สถิติ และสังคมศาสตร์ อันนำไปประยุกต์ใช้กับการทำนายในบริบทอื่นๆ ได้อีกด้วย


AI ในฐานะ ‘เครื่องจักรแห่งการทำนาย’


ก่อนที่เราจะพูดถึง Unified Theory of Prediction เรามาทำความเข้าใจก่อนว่า AI ทั้งหมดทำงานอย่างไร ไม่ว่าจะเป็น Predictive AI หรือ Generative AI เบื้องหลังความซับซ้อนทั้งหมดล้วนทำงานด้วยหลักการเดียวกัน คือ ‘การทำนาย’

ตามที่ Ajay Agrawal และคณะอธิบายไว้ในหนังสือ ‘Prediction Machines’ ฟังก์ชันหลักของ AI คือการทำนาย โดย Predictive AI พยากรณ์ปรากฏการณ์ภายนอก เช่น พฤติกรรมผู้บริโภค แนวโน้มตลาด หรือรูปแบบประชากร ขณะที่ Generative AI ทำนายองค์ประกอบถัดไปของเนื้อหา ไม่ว่าจะเป็นคำถัดไปในข้อความ พิกเซลถัดไปในภาพ หรือโน้ตถัดไปในบทเพลง

ยกตัวอย่างให้เห็นภาพ คือในขณะที่ Facebook ทำนายว่าคุณจะคลิกที่โฆษณาใด Netflix ทำนายว่าคุณจะชอบหนังเรื่องไหน และ Amazon ทำนายว่าคุณจะซื้อสินค้าอะไร เมื่อ ChatGPT สร้างประโยค มันกำลังทำนายว่า ‘คำต่อไป’ ควรเป็นอะไร เมื่อ DALL-E สร้างภาพ มันกำลังทำนายว่า ‘พิกเซลถัดไป’ ควรมีลักษณะอย่างไร

จะเห็นได้ชัดว่า ทั้งสองระบบต่างทำงานด้วยกลไกการทำนายคล้ายกัน คำถามคืออะไรเป็นสาเหตุที่ทำให้คุณภาพของการทำนายแตกต่างกันอย่างชัดเจน?

คำตอบอยู่ที่ปัจจัยพื้นฐานสองประการที่กำหนดคุณภาพของการทำนาย:

1.การสูญเสียข้อมูลเมื่อความจริงดิบหรือเนื้อหาถูกเปลี่ยนให้เป็นตัวเลข (quantification)

2.การตอบสนองของระบบที่ถูกทำนาย (system reactivity)

ทั้งสองเป็นแนวคิดที่มาจากสายสังคมศาสตร์ โดยได้รับอิทธิพลสำคัญมาจากงานวิจัยของ Wendy Espeland และคณะชื่อว่า ‘Rankings and Reactivity: How Public Measures Recreate Social World’ แต่ก่อนไปถึงมุมมองของนักสังคมศาสตร์ เรามาร่วมทำความเข้าใจกันก่อนว่านักวิทยาการคอมพิวเตอร์และนักสถิติมีมุมมองต่อคุณภาพการทำนายอย่างไร


ทำไมความรู้ด้านสถิติและข้อมูลแบบเดิมไม่เพียงพอที่จะอธิบายความสำเร็จของ Generative AI?


นักวิทยาการคอมพิวเตอร์และนักสถิติมองว่าคุณภาพของการทำนายจะดีขึ้น ถ้าอัลกอริทึมที่ใช้ทำนายมีความซับซ้อนมากขึ้น และปริมาณข้อมูลที่ใช้ฝึกโมเดลเพิ่มมากขึ้น แต่ปัจจัยเหล่านี้ไม่เพียงพอที่จะอธิบายความสำเร็จของ Generative AI เมื่อเทียบกับ Predictive AI ในฐานะ ‘เครื่องจักรแห่งการทำนาย’

ประเด็นมีอยู่ว่า Generative AI กับ Predictive AI อาจไม่ได้ต่างกันในแง่ความซับซ้อนของอัลกอริทึมและปริมาณของข้อมูลที่ใช้ ทั้งคู่ล้วนมีความก้าวหน้าของอัลกอริทึมที่ซับซ้อนน่าทึ่งมากยิ่งขึ้น แม้ว่าโมเดลอย่าง GPT-4 จากฝั่ง Generative AI จะแลดูเหมือนเป็นตัวแทนโมเดลที่ซับซ้อนและล้ำสมัย แต่เอาเข้าจริงแล้ว โมเดลฝั่ง Predictive AI ก็ไม่ได้น้อยหน้าไปกว่ากันเลย บริษัทเทคโนโลยียักษ์ใหญ่นำอัลกอริทึมที่มีความคล้ายคลึงกับที่ใช้สำหรับ Generative AI มาใช้เพื่อทำนายความจริงดิบเช่นกัน

ในทำนองเดียวกัน ทั้ง Generative AI และ Predictive AI ถูกฝึกด้วยข้อมูลจำนวนมหาศาล Generative AI ถูกฝึกฝนบนคลังข้อมูลที่หลากหลายซึ่งรวมถึงส่วนสำคัญของอินเทอร์เน็ตสาธารณะ ขณะที่บริษัทเช่น Meta หรือ Facebook ฝึก Predictive AI ของตัวเองด้วยข้อมูลพฤติกรรมของผู้ใช้หลายพันล้านคน ยิ่งไปกว่านั้น ในแง่ของปริมาณข้อมูล Predictive AI อาจจะได้เปรียบ Generative AI ในบางโดเมนด้วยซ้ำ เพราะสามารถใช้ข้อมูลภายในมาฝึก AI ได้ โดยที่ Generative AI อาจเข้าไม่ถึง

ทั้งหมดนี้แสดงให้เห็นว่าแนวคิดของนักวิทยาการคอมพิวเตอร์และนักสถิติอาจไม่เพียงพอที่จะอธิบายความสามารถในการทำนายของ Generative AI เราจึงต้องหาแนวคิดอื่นเข้ามาเสริม นั่นก็คือแนวคิดจากสายสังคมศาสตร์ เช่นที่มาจาก Wendy Espeland และคณะที่ได้กล่าวถึงไว้แล้วข้างต้น


การสูญเสียข้อมูลเมื่อความจริงดิบหรือเนื้อหาถูกเปลี่ยนให้เป็นตัวเลข (quantification)


ก่อนจะให้ AI ทำการทำนาย เราจำเป็นต้องเปลี่ยนสิ่งที่เราอยากทำนายเป็นตัวเลขก่อนเสมอ สำหรับ Predictive AI คือความจริงดิบ และสำหรับ Generative AI คือเนื้อหา ไม่ว่าจะเป็นบทความ เสียง หรือภาพ การเปลี่ยนแปลงความจริงดิบมาเป็นตัวเลขทำให้เกิดการสูญเสียข้อมูลมากกว่าการเปลี่ยนแปลงเนื้อหามาเป็นตัวเลข และสิ่งนี้เป็นสาเหตุหนึ่งที่ทำให้ Generative AI ทำงานได้ดีกว่า Predictive AI

ยกตัวอย่างเช่น เมื่อเราจะทำนายพฤติกรรมการซื้อของผู้บริโภค Predictive AI ต้องลดทอนความซับซ้อนของมนุษย์อย่างมหาศาลให้เป็นเพียงตัวแปรไม่กี่ตัว เช่น ประวัติการซื้อ ข้อมูลเชิงประชากรศาสตร์ และการมีส่วนร่วมของผู้บริโภค การลดทอนนี้จำกัดความสามารถในการเรียนรู้ของโมเดลอย่างมาก ไม่ว่าอัลกอริทึมจะมีความซับซ้อนเพียงใดก็ตาม

ในทางตรงกันข้าม Generative AI ไม่ได้ทำงานกับความจริงดิบ แต่ทำงานกับเนื้อหาซึ่งมนุษย์ได้สกัดออกมาจากความจริงดิบแล้ว โดยอาจจะเรียกว่า Generative AI ทำงานกับความเป็นนามธรรมของความจริงดิบ (abstraction of reality) ไม่ใช่ความจริงดิบโดยตรง ไม่ว่าจะเป็นระบบสัญลักษณ์ที่มนุษย์ใช้สื่อสารเกี่ยวกับความจริง หรือภาพและเสียงที่มนุษย์สร้างขึ้นเพื่อจับบางแง่มุมของประสบการณ์

ถึงแม้ว่าการเปลี่ยนความจริงดิบไปเป็น abstraction of reality จะก่อให้เกิดการสูญเสียข้อมูลมหาศาล เพราะความจริงทุกแง่มุมไม่สามารถถูกบันทึกไว้เป็นเนื้อหาได้ แต่ก็ไม่เป็นไรสำหรับ Generative AI เพราะ Generative AI ทำงานอยู่ที่ระดับเนื้อหา ไม่ใช่ความจริงดิบ และการเปลี่ยนเนื้อหาไปเป็นตัวเลข ก็ไม่น่าจะทำให้เกิดการสูญเสียข้อมูลมากนัก เมื่อเทียบกับการเปลี่ยนความจริงดิบเป็นตัวเลขในกรณีของ Predictive AI


การตอบสนองของระบบ (system reactivity)


Predictive AI มักถูกใช้ในการทำนายพฤติกรรมของมนุษย์ และมนุษย์มีความรู้สึกนึกคิด ซึ่งทำให้มนุษย์เปลี่ยนแปลงพฤติกรรมของตัวเองได้ตลอดเวลาเมื่อรู้ว่าถูกทำนายอยู่ ยกตัวอย่าง ระบบแนะนำสินค้าอัตโนมัติของ Amazon จะแนะนำสินค้าให้กับลูกค้า เมื่อลูกค้าของ Amazon ได้รับการแนะนำสินค้าซ้ำๆ พวกเขาอาจจะรู้สึกเบื่อได้ และทำให้พวกเขาเปลี่ยนแปลงพฤติกรรม เช่น พึ่งพาระบบแนะนำสินค้าอัตโนมัติน้อยลง และทำการ search หรือ browse เว็บไซต์ของ Amazon แทนเพื่อหาสินค้าที่พวกเขาต้องการ สิ่งนี้แสดงให้เห็นถึงความผิดพลาดของ Predictive AI เช่น ระบบแนะนำสินค้าอัตโนมัติ ที่อาจจะเกิดขึ้นได้

ตรงกันข้าม Generative AI โดยทั่วไปจะทำนายโดเมนที่มีการตอบสนองต่ำหรือไม่มี กล่าวคือบรรดาภาษา ภาพ ดนตรี และเนื้อหาเชิงสร้างสรรค์อื่นๆ ไม่ได้ ‘ตอบสนอง’ ต่อการถูกทำนายในลักษณะเดียวกับพฤติกรรมมนุษย์ เมื่อ GPT-4 ทำนายคำถัดไปในประโยค ภาษาไม่ได้ปรับตัวเพื่อทำให้การทำนายนี้ยากขึ้น เมื่อ DALL-E สร้างภาพตามคำพรรณนา ขนบการสร้างภาพไม่ได้พัฒนาเชิงกลยุทธ์เพื่อหลบเลี่ยงการทำนายของอัลกอริทึม

ความแตกต่างพื้นฐานในการตอบสนองของระบบนี้ให้คำอธิบายที่น่าเชื่อถืออีกประการหนึ่งสำหรับความเหนือกว่าด้านคุณภาพการทำนายของ Generative AI เมื่อเทียบกับ Predictive AI และเป็นเหตุให้ Generative AI ดูจะประสบความสำเร็จมากกว่า Predictive AI


สู่ Unified Theory of Prediction


จากการวิเคราะห์ Predictive AI และ Generative AI ในฐานะ ‘เครื่องจักรแห่งการทำนาย’ เราจะเห็นได้ว่าทฤษฎีจากฝั่งวิทยาการคอมพิวเตอร์และสถิติอาจจะไม่เพียงพอต่อการอธิบายความสำเร็จของ Generative AI เมื่อเทียบกับ Predictive AI ดังนั้น เราจึงต้องนำทฤษฎีจากฝั่งสังคมศาสตร์เข้ามาช่วยอธิบาย ซึ่งฝั่งสังคมศาสตร์มองว่า Generative AI ทำงานได้ดีกว่า Predictive AI เพราะ Generative AI เล่นอยู่ใน ‘เกม’ ที่แตกต่างจาก Predictive AI วัตถุที่ Generative AI ต้องทำนายมีความแตกต่างจาก Predictive AI

กล่าวคือ Predictive AI เสียเปรียบตรงที่ทำงานกับความจริงดิบ เมื่อความจริงดิบเปลี่ยนเป็นตัวเลข จะทำให้สูญเสียข้อมูลจำนวนมหาศาล ต่างจาก Generative AI ที่ทำงานกับเนื้อหาซึ่งถูกสกัดออกมาจากความจริงดิบแล้ว ทำให้สูญเสียข้อมูลน้อยกว่าเมื่อ Generative AI เปลี่ยนเนื้อหาเป็นตัวเลข (หรือ vector) เพื่อทำการทำนาย นอกจากนี้ Predictive AI ยังทำงานอยู่ในโดเมนที่มีความตอบสนองสูง เมื่อมนุษย์รู้ว่าถูกทำนายอยู่ มนุษย์ย่อมสามารถที่จะเปลี่ยนแปลงพฤติกรรมได้อยู่เสมอ แต่ข้อความ ภาพ หรือเสียง ไม่ได้ตอบสนองเมื่อถูก Generative AI ทำนาย

จากการศึกษาเปรียบเทียบนี้ เราสามารถขยายทฤษฎีว่าด้วยคุณภาพของการทำนาย ที่ถูกสร้างขึ้นโดยนักวิทยาการคอมพิวเตอร์และนักสถิติ หลอมรวมทฤษฎีจากสังคมศาสตร์ เป็น ‘Unified Theory of Prediction’ โดยทฤษฎีใหม่นี้ระบุว่ามี 4 ปัจจัยที่กำหนดคุณภาพของการทำนาย:

  1. ความซับซ้อนของอัลกอริทึมที่ใช้ทำนาย (จากวิทยาการคอมพิวเตอร์และสถิติ)
  2. ปริมาณของข้อมูลที่ใช้ฝึกโมเดล (จากวิทยาการคอมพิวเตอร์และสถิติ)
  3. ข้อมูลที่สูญเสียไปเมื่อเปลี่ยนความจริงหรือนามธรรมแห่งความจริงเป็นตัวเลข (สังคมศาสตร์)
  4. ความสามารถของระบบที่จะตอบสนอง (สังคมศาสตร์)


นัยยะที่กว้างขึ้นของ Unified Theory of Prediction


Unified Theory of Prediction สามารถประยุกต์ใช้อธิบายการทำนายประเภทอื่นๆ ได้ด้วย ดังที่แสดงในตาราง 2×2 ต่อไปนี้ ซึ่งจัดกลุ่มระบบการทำนายตามสองปัจจัยหลัก:

  1. ระดับการสูญเสียข้อมูลจากการเปลี่ยนความจริงดิบหรือเนื้อหาให้เป็นตัวเลข
  2. ความสามารถของระบบที่จะตอบสนองต่อการทำนาย



จากกรอบแนวคิดดังกล่าว เราจะเห็นว่า Generative AI สามารถทำนายได้อย่างแม่นยำเพราะมีคุณลักษณะสำคัญสองประกา ร ได้แก่ การสูญเสียข้อมูลในระดับต่ำ (low information loss in commensuration/quantification) และระบบที่ถูกทำนายมีการตอบสนองต่ำ (low system reactivity)

ในทางตรงกันข้าม Predictive AI แบบดั้งเดิมมีประสิทธิภาพการทำนายที่ต่ำกว่า เนื่องจากประสบปัญหาการสูญเสียข้อมูลในระดับสูง (high information loss) และทำงานกับระบบที่มีการตอบสนองสูง (high system reactivity)

นอกจากนี้ เรายังสามารถใช้กรอบแนวคิด Unified Theory of Prediction เพื่อทำความเข้าใจระบบการทำนายอื่นๆ ได้ด้วย เช่น

  • ระบบทางกายภาพ (physical systems) เช่น การพยากรณ์อากาศ ซึ่งมีการสูญเสียข้อมูลในระดับสูง (high information loss) แต่ระบบมีการตอบสนองต่ำ (low system reactivity) เนื่องจากสภาพอากาศไม่ได้เปลี่ยนแปลงเพราะถูกทำนาย
  • AI สำหรับเกม เช่น AI ที่เล่นหมากรุก ซึ่งมีการสูญเสียข้อมูลในระดับต่ำ (low information loss) เพราะสามารถแทนสถานะของเกมด้วยตัวเลขได้อย่างสมบูรณ์ แต่อาจมีการตอบสนองที่สูง (high systemreactivity) เมื่อต้องเล่นกับคู่ต่อสู้ที่ปรับกลยุทธ์ตามการเล่นของ AI


Unified Theory of Prediction นี้มีนัยยะสำคัญต่อวงการ AI และการทำนายในวงกว้าง เราสามารถพัฒนา Predictive AI ให้มีประสิทธิภาพมากขึ้นโดยการลดการสูญเสียข้อมูลในกระบวนการแปลงความจริงดิบเป็นตัวเลข เช่น การพัฒนาวิธีการเก็บข้อมูลที่สะท้อนพฤติกรรมมนุษย์ได้ครอบคลุมมากขึ้น หรือการออกแบบระบบที่ตระหนักถึงการตอบสนองของผู้ใช้ นอกจากนี้ เราอาจเห็นการผสมผสานระหว่าง Generative AI และ Predictive AI ในรูปแบบระบบไฮบริด โดย Generative AI อาจช่วยสร้างข้อมูลสังเคราะห์ เพื่อฝึก Predictive AI หรือช่วยแปลงความจริงดิบเป็นตัวเลขได้มีประสิทธิภาพมากขึ้น

ทฤษฎีนี้ยังชี้ให้เห็นถึงความสำคัญของการวิจัยข้ามศาสตร์ โดยเฉพาะการผสมผสานระหว่างวิทยาการคอมพิวเตอร์ สถิติ และสังคมศาสตร์ เพื่อสร้างความเข้าใจที่ลึกซึ้งเกี่ยวกับการทำนายและ AI อีกทั้งกรอบแนวคิดนี้สามารถนำไปประยุกต์ใช้ในการพัฒนาระบบการทำนายในบริบทอื่นๆ เช่น การเงิน การแพทย์ หรือวิทยาศาสตร์ข้อมูล โดยพิจารณาทั้งปัจจัยด้านเทคนิคและปัจจัยทางสังคม

นอกจากนี้ Unified Theory of Prediction ยังช่วยให้เรามองเห็นว่า AI ทั้งหมดเป็น ‘เครื่องจักรแห่งการทำนาย’ ที่มีข้อจำกัดและจุดแข็งแตกต่างกันไปตามบริบทการใช้งาน ซึ่งอาจนำไปสู่การถกเถียงเชิงปรัชญาเกี่ยวกับธรรมชาติของการทำนาย ความเข้าใจนี้จะช่วยให้เรามองเห็นข้อจำกัดของระบบ AI และสามารถกำกับดูแลการใช้งานได้อย่างเหมาะสม

ในท้ายที่สุด การมองว่า AI ทั้งหมดเป็นเครื่องจักรแห่งการทำนาย และเข้าใจปัจจัยที่กำหนดคุณภาพของการทำนาย ไม่เพียงแต่ช่วยให้เราไม่เพียงแต่พัฒนาและใช้งาน AI ได้อย่างมีประสิทธิภาพมากขึ้น แต่ยังช่วยให้เราเข้าใจข้อจำกัดที่แท้จริงของมัน เพื่อที่จะสามารถใช้ประโยชน์จาก AI ได้อย่างเหมาะสมในอนาคต

MOST READ

Life & Culture

14 Jul 2022

“ความตายคือการเดินทางของทั้งคนตายและคนที่ยังอยู่” นิติ ภวัครพันธุ์

คุยกับนิติ ภวัครพันธุ์ ว่าด้วยเรื่องพิธีกรรมการส่งคนตายในมุมนักมานุษยวิทยา พิธีกรรมของความตายมีความหมายแค่ไหน คุณค่าของการตายและการมีชีวิตอยู่ต่างกันอย่างไร

ปาณิส โพธิ์ศรีวังชัย

14 Jul 2022

Life & Culture

27 Jul 2023

วิตเทเกอร์ ครอบครัวที่ ‘เลือดชิด’ ที่สุดในอเมริกา

เสียงเห่าขรม เพิงเล็กๆ ริมถนนคดเคี้ยว และคนในครอบครัวที่ถูกเรียกว่า ‘เลือดชิด’ ที่สุดในสหรัฐอเมริกา

เรื่องราวของบ้านวิตเทเกอร์ถูกเผยแพร่ครั้งแรกทางยูทูบเมื่อปี 2020 โดยช่างภาพที่ไปพบพวกเขาโดยบังเอิญระหว่างเดินทาง ซึ่งด้านหนึ่งนำสายตาจากคนทั้งเมืองมาสู่ครอบครัวเล็กๆ ครอบครัวนี้

พิมพ์ชนก พุกสุข

27 Jul 2023

Life & Culture

26 Mar 2021

ผี เรื่องผี อดีต ความทรงจำและการหลอกหลอนในโรงเรียนผีดุ

เมื่อเรื่องผีๆ ไม่ได้มีแค่ความสยอง! อาทิตย์ ศรีจันทร์ วิเคราะห์พลวัตของเรื่องผีในสังคมไทย ผ่านเรื่องสั้นใน ‘โรงเรียนผีดุ’ วรรณกรรมสยองขวัญเล่มใหม่ของ นทธี ศศิวิมล

อาทิตย์ ศรีจันทร์

26 Mar 2021

เราใช้คุกกี้เพื่อพัฒนาประสิทธิภาพ และประสบการณ์ที่ดีในการใช้เว็บไซต์ของคุณ คุณสามารถศึกษารายละเอียดได้ที่ นโยบายความเป็นส่วนตัว และสามารถจัดการความเป็นส่วนตัวเองได้ของคุณได้เองโดยคลิกที่ ตั้งค่า

Privacy Preferences

คุณสามารถเลือกการตั้งค่าคุกกี้โดยเปิด/ปิด คุกกี้ในแต่ละประเภทได้ตามความต้องการ ยกเว้น คุกกี้ที่จำเป็น

Allow All
Manage Consent Preferences
  • Always Active

Save