เราจะแยกออกไหมว่ากำลังพูดกับคนหรือเอไอ ?

ที่มาของภาพ, Jesussanz/Getty Images
- Author, เดย์ซี สตีเฟนส์
- Role, บีบีซี เวิลด์ เซอร์วิส
เราแยกออกหรือไม่ว่ากำลังพูดคุยกับคนอีกคนหนึ่งหรือปัญญาประดิษฐ์ (เอไอ)?
เมื่อนานมาแล้วคำถามด้านบนนี้คือหนึ่งในคำถามที่คนเคยมีคำถามเพื่อตัดสินว่าเหล่าคอมพิวเตอร์นั้นฉลาดเพียงใด
คำถามนี้มาจากการทดสอบที่เรียกว่า "การทดสอบของทัวริง" หรือ The Turing Test ที่ถูกคิดค้นเมื่อปี 1950 โดยอลัน ทัวริง นักคณิตศาสตร์และนักวิทยาศาสตร์คอมพิวเตอร์ชาวอังกฤษซึ่งดัดแปลงคำถามเชิงปรัชญาว่าเครื่องจักรมีเชาว์ปัญญาหรือไม่ โดยเขาทำให้คำถามนี้กลายเป็นการทดสอบเชิงประจักษ์ขึ้นเป็นครั้งแรก
ตามการทดสอบนี้ หากเราไม่สามารถแยกพฤติกรรมของคอมพิวเตอร์ออกจากพฤติกรรมของมนุษย์ได้ก็ย่อมปรากฏแล้วว่าพฤติกรรมนั้นเป็นพฤติกรรมที่นับว่ามีเชาว์ปัญญา

ที่มาของภาพ, Pictures from History/Universal Images Group via Getty Images
ในปี 2014 มีแชทบอทเอไอหนึ่งได้รับการกล่าวขานว่าได้ผ่านการทดสอบนี้เป็นครั้งแรก อย่างไรก็ดี แทนที่เรื่องนี้จะเป็นวินาทีแห่งประวัติศาสตร์ แต่มันกลับโหมกระพือความเห็นต่างให้เกิดขึ้นยิ่งขึ้นไปอีก
เกมลอกเลียนแบบ
การทดสอบทัวริงเป็นเกมลอกเลียนแบบโดยให้มนุษย์คนหนึ่งส่งข้อความแลกเปลี่ยนบทสนทนากับมนุษย์อีกคนและกับคอมพิวเตอร์
ผู้พูดคุยสามารถถามคำถามอะไรก็ได้ที่ตนต้องการ ก่อนที่จะต้องทายว่าคู่สนทนารายใดเป็นมนุษย์ และรายใดเป็นเครื่องจักรกล
ผศ.ดร.คาเมรอน โจนส์ นักวิชาการด้านจิตวิทยาประจำมหาวิทยาลัยสโตนี บรูค ในนิวยอร์กอธิบายว่า "ทัวริงกล่าวว่าหากคนไม่สามารถแยกระหว่างมนุษย์กับเครื่องจักรกลได้อีกต่อไป ดังนั้นเราก็จะไม่มีพื้นฐานอะไรให้แยกสองสิ่งนี้ออกจากกันได้แล้ว เพราะเดิมทีเราเคยแยกได้ด้วยแนวคิดว่ามนุษย์มีความสามารถในการคิด แต่เครื่องจักรกลไม่สามารถคิดได้"
ทัวริงเคยคาดการณ์ว่า ภายในปี ค.ศ. 2000 คอมพิวเตอร์จะสามารถทำให้ผู้คนเข้าใจผิดว่าเป็นมนุษย์ได้หลังจากถูกซักถามเป็นเวลาห้านาที อย่างน้อย 30% ของเวลาทั้งหมด

ที่มาของภาพ, Getty Images
'ไม่ได้ทดสอบอย่างตรงไปตรงมา'
ในปี 2014 แชทบอทเอไอที่มีชื่อว่า ยูจีน กูสท์แมน (Eugene Goostman) เข้าทดสอบในการทดสอบของทิวริง ผลการทดสอบปรากฏว่าแชทบอทตัวนี้สามารถโน้มน้าวให้กรรมการกว่า 33% เชื่อว่ามันเป็นมนุษย์ นอกจากนี้ยังผ่านเกณฑ์ที่ผู้จัดการแข่งขันตั้งขึ้นเพิ่มเติมอีกด้วย
แชทบอท ยูจีน กูสท์แมน สื่อสารด้วยภาษาอังกฤษ และใช้ภาพลักษณ์เป็นเด็กชายชาวยูเครนวัย 13 ปี
ดร.มาร์คัส แพนซาร์ นักปรัชญาและอาจารย์พิเศษของมหาวิทยาลัยแอร์เวห์เทห์ฮาห์ อาเคิน ( RWTH Aachen University) ในเยอรมนี กล่าวว่าผลการทดสอบนี้หมายความว่าแชทบอทนี้ "ไม่ได้เล่นเกมนี้อย่างตรงไปตรงมา"
เขาโต้แย้งว่า "ข้อบกพร่องของแชทบอทนั้นสอดคล้องกับข้อบกพร่องในการใช้ภาษาอังกฤษของวัยรุ่นชาวยูเครน"

ที่มาของภาพ, VCG via Getty Images
ตั้งแต่นั้นเป็นต้นมาก็มีรายงานว่าเครื่องมือที่ล้ำสมัยกว่าแชทบอทยูจีน กูสท์แมน หลายตัวก็ผ่านแบบทดสอบของทัวริง
ในงานวิจัยที่เผยแพร่ช่วงต้นปี 2025 ผศ.ดร.โจนส์พบว่าแชทจีพีที (ChatGPT) โมเดล 4.5 ก็ได้รับการตัดสินว่าเป็นมนุษย์กว่า 73% ของการทดสอบครั้งนั้น นับเป็นผลการทดสอบที่สูงกว่ามนุษย์ที่เข้าการตรวจสอบร่วมกันที่ถูกตัดสินว่าเป็นมนุษย์เพียง 56%
เขากล่าวว่า "ผมคิดว่าเราคงโต้แย้งได้ยากว่าโมเดลเหล่านี้ยังไม่ผ่านเกณฑ์ เนื่องจากมักถูกตัดสินว่าเป็นมนุษย์บ่อยกว่าคนจริงอย่างมีนัยสำคัญ"
อย่างไรก็ดี บางคนยังไม่ปักใจเชื่อว่าแบบทดสอบนี้สามารถพิสูจน์ได้อย่างเที่ยงตรงว่าเครื่องจักรกลนั้นคิดได้อย่างแท้จริงหรือไม่
ข้อโต้แย้งว่าด้วยห้องภาษาจีน
ในปี 1980 นักปรัชญาชื่อ จอห์น เซิร์ล นำเสนอการทดลองทางความคิดที่มีชื่อว่า "ข้อโต้แย้งว่าด้วยห้องภาษาจีน" (the Chinese room argument)
ข้อโต้แย้งดังกล่าวระบุว่า ชายชาวอังกฤษคนหนึ่งที่ไม่รู้ภาษาจีนถูกล็อกอยู่ในห้องที่มีอักษรภาษาจีนและคำอธิบายวิธีการใช้อักษรเหล่านั้นเป็นภาษาอังกฤษ
คนนอกห้องสอดโพยที่มีคำถามต่าง ๆ เขียนเป็นภาษาจีนเข้าไปในห้อง แล้วเขาก็ใช้คำอธิบายวิธีการใช้อักษรเพื่อตอบคำถาม
สำหรับคนนอกก็จะเข้าใจว่าชายคนดังกล่าวใช้ภาษาจีนเป็น แต่เขาไม่ได้เข้าใจอย่างถ่องแท้ว่าเขากำลังพูดอะไร หลายคนโต้แย้งว่าคอมพิวเตอร์ก็เป็นเช่นเดียวกัน กล่าวคือมันเพียงแต่ถูกตั้งโปรแกรมไว้ให้ตอบสนองตามที่กำหนดไว้

ที่มาของภาพ, Malte Mueller/Getty Images
จอร์จ แมปปูราส วิศวกรซอฟต์แวร์ในรัฐแคลิฟอร์เนีย ซึ่งได้คิดวิธีทดสอบทางเลือกแทนการทดสอบทัวริง กล่าวว่า "แม้ว่าการทดสอบทัวริงจะอ้างว่าตรวจสอบความฉลาด แต่จริง ๆ แล้วเป็นการดูว่าเครื่องจักรสามารถเลียนแบบมนุษย์ได้ดีเพียงพอหรือไม่"
โดยเขายกตัวอย่างเพื่ออธิบายเรื่องนี้ว่า "คุณสามารถเปิดบอทเอไอแล้วถามให้มันอธิบายการทำงานของนาฬิกาแบบเข็ม มันก็จะอธิบายได้อย่างแม่นยำ"
แต่ถ้าคุณขอให้มันสร้างภาพนาฬิกาที่แสดงเวลาเฉพาะ โมเดลเอไอในปัจจุบันมักจะทำไม่ได้
เขาอธิบายต่อว่า "มันไม่ได้เข้าใจข้อมูลจริง ๆ"
ขณะที่คนอื่น ๆ เช่น แพนซาร์ มองว่าการทดสอบทัวริงให้ความสำคัญกับการที่คอมพิวเตอร์สามารถหลอกผู้ตัดสินได้หรือไม่มากเกินไป
เขาแย้งว่า "พฤติกรรมที่ฉลาดจริงก็อาจรวมถึงการหลอกลวงได้ แต่โดยพื้นฐานแล้วนั่นไม่ใช่ส่วนสำคัญ"
การทดสอบทางเลือกอื่น ๆ
แพนซาร์ได้คิดค้นการทดสอบความฉลาดโดยอ้างอิงจากชุมชน (Community-Based Intelligence Test : CBIT) ซึ่งเป็นหนึ่งในทางเลือกหลายวิธีการที่ถูกเสนอขึ้นมาในช่วงหลายปีที่ผ่านมา
การทดสอบนี้ต่างจากการทดสอบทัวริงที่ทำในห้องทดลอง ในกรณีของเขา ระบบเอไอจะถูกนำไปไว้ในชุมชนที่มีอยู่แล้วโดยที่สมาชิกไม่รู้ตัว เช่น ชุมชนออนไลน์ของนักคณิตศาสตร์ หลังจากเวลาผ่านไป จะมีการทดสอบว่าสมาชิกในกลุ่มนั้นสังเกตได้หรือไม่ว่าระบบดังกล่าวแท้จริงแล้วเป็นคนหรือเป็นเครื่องจักรกล
แม้การทดสอบนี้จะยังมีการลวงเป็นองค์ประกอบอยู่บ้าง แต่แพนซาร์เชื่อว่าการทดสอบส่วนใหญ่จะเน้นไปที่ระบบ "แสดงพฤติกรรมเหมือนมนุษย์" ไม่ใช่ "สวมรอยเป็นมนุษย์" ซึ่งเขากล่าวว่าเป็นความแตกต่างที่สำคัญ
นักปรัชญารายนี้แย้งว่า "ความฉลาดควรถูกประเมินในสภาพแวดล้อมตามธรรมชาติ แบบที่เรามีปฏิสัมพันธ์จริง"
เขายังกล่าวว่าการทดสอบของเขายังช่วยกระตุ้นให้นักพัฒนามุ่งเน้นไปที่การสร้างให้ระบบเอไอมีประโยชน์ แทนที่จะมุ่งเน้นว่าเอไอจะผ่านการทดสอบว่าสามารถตบตามนุษย์ได้สำเร็จหรือไม่
ด้านจอห์น แมปปูราส ก็ได้คิดค้นการทดสอบที่เขากล่าวว่ามุ่งวัดความฉลาดในเชิงรูปธรรม เขากล่าวถึงแนวคิดปัญญาประดิษฐ์โดยทั่วไป (Artificial General Intelligence : AGI) ซึ่งเป็นแนวคิดเชิงทฤษฎีที่กล่าวถึงอุดมคติที่เครื่องจักรจะมีศักยภาพทางปัญญาเทียบเท่ามนุษย์ โดยเชื่อว่าสถานะดังกล่าวจะเกิดขึ้นได้หากเครื่องจักรสามารถ "สร้างองค์ความรู้ทางวิทยาศาสตร์ใหม่และอธิบายได้" ตราบใดที่มันมีข้อมูลที่จำเป็นทั้งหมดอยู่แล้ว

ที่มาของภาพ, Oscar Wong/Getty Images
แม้จะมีเสียงวิจารณ์ แต่บางคนเชื่อว่าการทดสอบทัวริงยังคงมีบทบาทในงานวิจัยเอไอสมัยใหม่
โจนส์กล่าวว่าการที่การทดสอบทัวริงเปิดกว้างและไม่มีการกำหนดคำถามอย่างชัดเจน ทำให้สามารถทดสอบ "ความฉลาดในมิติของความยืดหยุ่นและพลวัตในบางรูปแบบได้"
เขากล่าวเพิ่มเติมอีกว่า "ถ้าเราแทนที่มันด้วยเกณฑ์มาตรฐานแบบตายตัวอีกแบบหนึ่ง ผมคิดว่านั่นเป็นการเข้าใจผิดในสิ่งที่ทัวริงตั้งใจจะสื่อ"
'การต่อสู้ที่มีแต่แพ้'
ไม่ว่าจะใช้การทดสอบแบบใด แพนซาร์เชื่อว่าเมื่อระบบเอไอพัฒนาต่อไปจะมีแนวโน้มที่เราจะไม่สามารถแยกเอไอออกจากมนุษย์ได้อีกต่อไป
"ท้ายที่สุดแล้ว นี่คือการต่อสู้ที่เราไม่มีวันชนะ" เขากล่าว
และเพื่อให้คนแยกมนุษย์ออกจากเอไอได้ เขาแย้งว่าจะเป็นเหตุผลที่ชอบธรรมที่เราต้องสร้างกรอบกฎหมายที่บังคับให้เอไอต้องเปิดเผยตัวตนว่าเป็นเอไอหรือไม่เพื่อให้เกิดความรับผิดรับชอบ
"ถ้าผมตีพิมพ์งานวิจัยที่มีข้อมูลผิดพลาด ผมต้องรับผิดชอบ" แพนซาร์กล่าว "แต่ถ้าเป็นงานวิจัยที่เขียนโดยเอไอ มันไม่มีใครต้องรับผิดชอบเลย"

ที่มาของภาพ, 10'000 Hours/Getty Images
โจนส์มองว่าสิ่งสำคัญคือการวัดว่าระบบสามารถเลียนแบบมนุษย์ได้ดีเพียงใด ทำให้การทดสอบทัวริงยังคงมีความเกี่ยวข้องอยู่ในปัจจุบัน
"เรามีเวลามากมายที่ใช้ไปกับการโต้ตอบกับผู้คนบนอินเทอร์เน็ต" เขากล่าว "และผู้คนเริ่มมีประสบการณ์แบบ… ทะเลาะกับบัญชีในทวิตเตอร์แล้วตระหนักว่า 'จริง ๆ แล้ว ฉันไม่ได้คุยกับมนุษย์' มากขึ้นเรื่อย ๆ "
"หนึ่งในสิ่งที่ผมคิดว่าการทดสอบทัวริงทำได้คือการติดตามความสามารถนี้ เพื่อดูว่ามีแนวโน้มเกิดขึ้นมากแค่ไหน" เขากล่าวเสริม











