"บ.เทคโนโลยีขโมยเสียงของพวกเราไป แล้วใช้เอไอโคลนเสียงแล้วขายต่อ"

Paul Skye Lehrman and Linnea Sage, who claim their voices were stolen, sit in armchairs with neutral expressions.
คำบรรยายภาพ, พอล สกาย เลห์ร์มัน และ ลินเนีย เซจ ได้ดำเนินคดีแบบกลุ่มต่อบริษัทโลโว่ (Lovo)
    • Author, เบน เดอริโค
    • Role, ผู้สื่อข่าวเทคโนโลยี
    • Reporting from, ซานฟรานซิสโก

เชื่อกันว่าในช่วงไม่กี่ปีที่ผ่านมา หลายคนน่าจะได้ยินคำพูดในทำนองว่าปัญญาประดิษฐ์ (เอไอ) อาจจะมาแทนที่งานของเราในวันหนึ่ง

ทว่าสำหรับพอล สกาย เลห์ร์มัน คำพูดเหล่านี้ได้กลายเป็นเรื่องส่วนตัว ที่เยือกเย็น และคาดไม่ถึงเพราะเสียงเตือนที่เขาได้ยินนั้น กลับเป็นเสียงของเขาเอง

ในเดือน มิ.ย. 2023 ขณะที่พอลและคนรัก ลินเนีย เซจ กำลังขับรถระแวกบ้านในนครนิวยอร์กของสหรัฐอเมริกา ฟังพอดแคสต์เกี่ยวกับการประท้วงที่ยังคงเกิดขึ้นในฮอลลีวูดและผลกระทบที่ปัญญาประดิษฐ์ (เอไอ) อาจมีต่อวงการบันเทิง

พอดแคสต์ตอนดังกล่าวน่าสนใจเพราะทั้งคู่เป็นนักพากย์เสียง ซึ่งเหมือนกับคนในวงการนักสร้างสรรค์คนอื่น ๆ ที่เกรงว่าเครื่องมือสร้างเสียงที่คล้ายมนุษย์อาจจะถูกนำมาใช้แทนที่พวกเขาในเร็ว ๆ นี้

รายการพอดแคสต์นี้มีจุดดึงดูดเฉพาะตัว คือ พวกเขาสัมภาษณ์แชทบอทที่ขับเคลื่อนด้วยเอไอ พร้อมด้วยซอฟต์แวร์แปลงข้อความเป็นเสียง เพื่อถามว่าเอไอ คิดว่าเอไอจะส่งผลกระทบต่อการจ้างงานในฮอลลีวูดอย่างไร

ทว่าเสียงที่แชทบอทพูดออกมานั้น กลับฟังดูเหมือนเสียงของเลห์ร์มัน

“เราต้องจอดรถข้างทาง” เขากล่าว

“ความขัดแย้งที่ว่าเอไอ กำลังมุ่งเข้าสู่อุตสาหกรรมบันเทิง และนี่คือเสียงของผมที่กำลังพูดถึงความเป็นไปได้ในการทำลายล้างอุตสาหกรรม มันช็อกจริง ๆ”

คืนนั้นพวกเขาใช้เวลาหลายชั่วโมงออนไลน์เพื่อค้นหาข้อมูลจนพบเว็บไซต์ของแพลตฟอร์มแปลงข้อความเป็นเสียงชื่อโลโว่ (Lovo) บนเว็บไซต์นั้น เซจก็พบเสียงของเธอเองเช่นกัน

“ฉันตกใจมาก” เธอกล่าว “ฉันไม่อยากจะเชื่อเลย”

“บริษัทเทคโนโลยีขโมยเสียงของเรา ใช้เอไอถอดแบบหรือโคลนเสียง แล้วก็ขายมันไปเป็นร้อยพันครั้ง”

ขณะนี้พวกเขาได้ยื่นฟ้องเพื่อดำเนินคดีต่อ Lovo แล้ว บริษัทดังกล่าวยังไม่ได้ตอบสนองต่อคำฟ้องหรือคำขอความเห็นจากบีบีซี

สงครามการสร้างเลียนแบบ

ทว่าโลโว่สามารถสร้างเสียงของทั้งคู่ขึ้นมาใหม่ได้อย่างไร ?

ตอนนี้คู่รักผู้ถูกขโมยเสียงกล่าวหาว่า บริษัทได้มีการกระทำบางอย่างที่เกี่ยวข้องกับการหลอกลวง

ทอม ลี ผู้ร่วมก่อตั้งโลโว่เคยกล่าวไว้ก่อนหน้านี้ว่าซอฟต์แวร์จำลองเสียงของบริษัทต้องการเพียงให้ผู้ใช้อ่านข้อความประมาณ 50 ประโยคเพื่อสร้างเสียงโคลนที่เหมือนจริง

“เราสามารถจับโทนเสียง ลักษณะ ตัวสไตล์ พยางค์ และแม้กระทั่งหากคุณมีสำเนียง เราก็สามารถจับสิ่งนั้นได้เช่นกัน” เขากล่าวในการให้สัมภาษณ์กับพอดแคสต์ Future Visionaries ในปี 2021

ในคำร้อง ทั้งเลห์ร์มันและเซจได้ระบุถึงวิธีการที่พวกเขาเชื่อว่าทำให้บริษัทโลโว่ได้รับบันทึกเสียงของพวกเขา

พวกเขาอ้างว่าพนักงานโลโว่ที่ไม่ระบุตัวตนได้ติดต่อพวกเขาเพื่อบันทึกเสียงผ่าน Fiverr ซึ่งเป็นเว็บไซต์ยอดนิยมสำหรับการจ้างงานฟรีแลนซ์ที่พวกเขาขายบริการให้เสียงสำหรับโทรทัศน์ วิทยุ วิดีโอเกม และสื่ออื่น ๆ

ในปี 2019 เซจกล่าวว่ามีผู้ใช้คนหนึ่งติดต่อเธอให้บันทึกเสียงสคริปต์ทดสอบวิทยุที่ฟังดูทั่วไปหลายสิบรายการ

การบันทึกเสียงทดสอบมักใช้ในภาพยนตร์และโทรทัศน์สำหรับการสนทนากลุ่ม (focus group) การประชุมภายใน หรือใช้เป็นตัวแทนสำหรับงานที่ยังไม่เสร็จ เนื่องจากจะไม่ถูกเผยแพร่อย่างกว้างขวาง การบันทึกเหล่านี้จึงมีราคาถูกกว่าเสียงที่ใช้สำหรับการกระจายเสียง

เซจกล่าวว่าเธอทำงานนั้น ส่งไฟล์ และได้รับเงิน 400 ดอลลาร์สหรัฐ [ประมาณ 13,700 บาท]

ประมาณหกเดือนต่อมา เลห์ร์มันกล่าวว่าเขาได้รับคำขอที่คล้ายกันให้บันทึกเสียงโฆษณาวิทยุที่ฟังดูทั่วไปหลายสิบรายการ

Messages exchanged, which state "we are researching speech synthesis... your voiceover will be used for academic research purposes only"
คำบรรยายภาพ, ข้อความบทสนทนาโดยมีใจความในส่วนที่เน้นแถบสีระบุว่า: “เรากำลังวิจัยการสังเคราะห์เสียงพูด... การพากย์เสียงของคุณจะถูกใช้เพื่อวัตถุประสงค์ในการวิจัยทางวิชาการเท่านั้น”

ในข้อความที่นักพากษ์เสียงทั้งคู่ได้แชร์กับบีบีซี ผู้ใช้งาน Fiverr ที่ไม่ระบุตัวตนกล่าวว่าไฟล์เสียงจะถูกใช้เพื่อการวิจัยเกี่ยวกับ "การสังเคราะห์เสียงพูด"

หลังจากที่เลห์มันขอให้ผู้ใช้งานรับประกันว่าสคริปต์จะไม่ถูกใช้ภายนอกโครงการวิจัยเฉพาะของพวกเขา เขาถามต่อว่าเป้าหมายของโครงการคืออะไร

“สคริปต์จะไม่ถูกใช้เพื่อสิ่งอื่นใด” ผู้ใช้งานคนนั้นกล่าว “และผมยังไม่สามารถบอกคุณได้ว่าเป้าหมายคืออะไร เนื่องจากเป็นงานที่ยังอยู่ในขั้นตอนที่ต้องเก็บเป็นความลับ ขอโทษนะครับ ฮ่า ๆ [เสียงหัวเราะ]”

เลห์ร์มันถามว่าหากไฟล์ที่บันทึกเสียงเสร็จแล้วจะถูกนำไปใช้ใหม่หรือใช้ในลำดับที่แตกต่างกันหรือไม่ ผู้ใช้งานคนนั้นตอบว่าไฟล์จะถูกใช้เพื่อวัตถุประสงค์ในการวิจัยเท่านั้น เลห์ร์มันกล่าวว่าเขาส่งไฟล์และได้รับเงิน 1,200 ดอลลาร์สหรัฐฯ [ประมาณ 41,000 บาท]

จากนั้นลิงก์ที่เชื่อมโยงระหว่างผู้ใช้ที่ไม่ระบุตัวตนกับบริษัทโลโว่ก็ถูกส่งมายังพวกเขา โดยลิงก์เหล่านั้นก็ระบุชัดว่ามาจากบริษัทโลโว่เอง

พวกเขาได้แชร์หลักฐานที่พวกเขาพบว่าเสียงของพวกเขาถูกโคลนกับโลโว่ แต่บริษัทตอบกลับมาว่าพวกเขาไม่ได้ทำอะไรผิด โดยชี้ไปที่การสื่อสารระหว่างพวกเขากับผู้ใช้ที่ไม่ระบุตัวตนเป็นหลักฐานว่าพวกเขาได้มีการติดต่อกันอย่างถูกต้องตามกฎหมาย

“ในอาชีพของเรา เราได้ส่งมอบไฟล์เสียงมากกว่า 100,000 ไฟล์” เลห์ร์มันกล่าวถึงงานของพวกเขาบน Fiverr ในช่วงเกือบสิบปี

“เราสามารถงมเข็มในมหาสุมทรได้ และพวกเขาทำให้เราต้องงมเข็มในมหาสมุทร”

ทั้งเลห์ร์มันและเซจกล่าวว่า พวกเขาไม่ได้มีสัญญาเป็นลายลักษณ์อักษร มีเพียงแค่การสนทนาเหล่านี้เท่านั้น บีบีซียังไม่สามารถตรวจสอบความถูกต้องของการสนทนาทั้งหมดได้ ทั้งคู่กล่าวว่าผู้ใช้งานไม่ระบุตัวตนที่พวกเขาคุยด้วยยังดูเหมือนจะลบข้อความบางส่วนด้วย

บีบีซีได้ติดต่อโลโว่หลายครั้งเพื่อขอสัมภาษณ์กับนายลีและเพื่อขอความคิดเห็นเกี่ยวกับข้อกล่าวหาของทั้งคู่ แต่พวกเขาไม่ได้ตอบกลับข้อความใด ๆ ของเราเลย

A message which states these are "test scripts" which will "not be disclosed externally".
คำบรรยายภาพ, ข้อความบทสนทนาโดยมีใจความในส่วนที่เน้นแถบสีระบุว่า: “นี่เป็นสคริปต์ทำสอบสำหรับโฆษณาทางวิทยุ จะไม่มีการเปิดเผยสู่สาธารณะ และจะไม่มีการนำมาใช้ภายในเช่นเดียวกัน เพราะฉะนั้นไม่จำเป็นต้องมีการระบุสิทธิใด ๆ”

กฎหมายว่าอย่างไร ?

ทั้งคู่ยื่นฟ้องดำเนินคดีในเดือน พ.ค. กล่าวหาโลโว่ว่าใช้การบันทึกเสียงของพวกเขาเพื่อสร้างสำเนาที่เข้ามาแข่งขันกับเสียงจริงของเซจและเลห์ร์มันอย่างผิดกฎหมาย

ทั้งคู่กล่าวว่าบริษัทได้กระทำเช่นนี้โดยไม่ได้รับอนุญาตหรือค่าตอบแทนที่เหมาะสม

นี่เป็นการฟ้องร้องแบบกลุ่ม หมายความว่าพวกเขาหวังว่าจะมีผู้เรียกร้องรายอื่นเข้าร่วมด้วย แม้ว่าจนถึงขณะนี้จะยังไม่มีใครเข้าร่วมก็ตาม

ศาสตราจารย์คริสเทเลีย การ์เซีย ผู้เชี่ยวชาญด้านกฎหมายทรัพย์สินทางปัญญาที่มหาวิทยาลัยจอร์จทาวน์ในกรุงวอชิงตัน ดี.ซี. กล่าวว่า คดีนี้มีแนวโน้มที่จะมุ่งเน้นไปที่กฎหมายของสหรัฐที่เรียกว่า สิทธิในชื่อเสียง (rights of publicity)

บางครั้งเรียกว่าสิทธิส่วนบุคคล การละเมิดชื่อเสียงของบุคคลมักเกิดจากการใช้หรือแสดงภาพลักษณ์หรือเสียงของใครบางคนในทางที่ผิดหรือผิดความหมาย

เธอยังกล่าวด้วยว่า อาจมีการละเมิดสัญญาเกี่ยวกับใบอนุญาตที่เซจและเลห์ร์มันได้มอบให้กับผู้ใช้ที่สั่งงานบันทึกเสียง

“ใบอนุญาตเป็นการอนุญาตให้ใช้ในวิธีที่เฉพาะเจาะจงและจำกัดมาก ฉันอาจให้ใบอนุญาตให้คุณใช้สระว่ายน้ำของฉันในช่วงบ่ายวันหนึ่ง แต่ไม่ได้หมายความว่าคุณสามารถมาเมื่อไรก็ได้และจัดปาร์ตี้ในสระว่ายน้ำของฉัน” เธอกล่าวกับบีบีซี

“นั่นจะเกินขอบเขตของใบอนุญาต”

ไม่ว่าจะมีผลลัพธ์อย่างไร คดีนี้เป็นอีกหนึ่งในคดีความมากมายที่เชื่อมโยงกับศิลปิน นักเขียน นักวาดภาพประกอบ และนักดนตรีผู้ได้ยื่นฟ้องเพื่อไม่ให้สูญเสียการควบคุมงานและชีวิตความเป็นอยู่ของพวกเขา

และนี่อาจเป็นเพียงส่วนเล็ก ๆ ของภูเขาน้ำแข็งเท่านั้น ในสัปดาห์นี้ บริษัทการเงิน Klarna กล่าวว่ามีแผนที่จะใช้เอไอเพื่อลดพนักงานลงครึ่งหนึ่ง

ผู้เชี่ยวชาญบางคนคาดการณ์ว่าในที่สุดงานทั้งหมด 40% จะได้รับผลกระทบจากเอไอ

สำหรับเลห์ร์มันและเซจ อนาคตที่น่ากังวลนี้กำลังเกิดขึ้นแล้ว

“ประสบการณ์ทั้งหมดนี้รู้สึกเหมือนไม่ใช่ความจริงเลย” เซจกล่าว

“เมื่อเรานึกถึงปัญญาประดิษฐ์ เรานึกถึงเอไอที่จะมาช่วยพับผ้าและทำอาหารเย็นให้เรา ไม่ใช่ไล่ตามความพยายามสร้างสรรค์ของมนุษย์”