வாய்ஸ் குளோனிங்: வெறும் 10 நிமிட குரல் பதிவை வைத்துக் கொண்டு 15 மொழிகளில் பேச வைக்கலாம் - மனிதனை விஞ்சும் தொழில்நுட்பம்

டிம் ஹெல்லர்

பட மூலாதாரம், TIM HELLER

படக்குறிப்பு, டிம் ஹெல்லர்
    • எழுதியவர், கிட்டி பல்மாய்
    • பதவி, வணிக செய்தியாளர்

தன் குரலின் ஒலிப் பிரதியைக் கேட்ட போது, அது அத்தனை துல்லியமாக இருந்ததாக ஆச்சர்யப்பட்டு போனார் டிம் ஹெல்லர்.

ஒரு கணினி மென்பொருள் பயன்படுத்தப்பட்டு ஒரு நபரின் குரலை பிரதி எடுப்பதுதான் வாய்ஸ் குளோனிங் என்கிறார்கள்.

ஒருவர் பேசும் போது அவரின் குரலைப் பதிவு செய்தபின், கீபோர்டில் நீங்கள் தட்டச்சு செய்யும் வார்த்தைகள் மற்றும் வாக்கியங்களை அதே குரலில் மென்பொருளால் பேச முடியும். அந்த அளவுக்கு சமீபத்தைய தொழில்நுட்பம் வளர்ச்சி கண்டிருக்கிறது.

அம்மென்பொருள் வெறுமனே ஒருவரின் உச்சரிப்புகளை மட்டும் புரிந்து கொள்வதில்லை. ஒருவர் பேசும் வேகம், குரலின் ஒலிப் பண்புகள், சுருதி, சுவாசிக்கும் முறை போன்ற பல பண்புகளையும் மென்பொருள் உள்வாங்கிக் கொள்கிறது.

இப்படி பிரதி எடுக்கப்படும் குரல்களில் தேவையான மாற்றங்களைச் செய்ய முடியும். கோபம், பயம், மகிழ்ச்சி, காதல் போன்ற உணர்வுகளை மாற்றி வெளிப்படுத்த வைக்க முடியும்.

அமெரிக்காவின் டெக்சாஸ் மாகாணத்தைச் சேர்ந்த டிம் ஹெல்லர் ஒரு குரல் கலைஞராக இருக்கிறார். இவர் கார்ட்டூன் கதாபாத்திரங்களுக்கு குரல் கொடுத்துள்ளார், ஒலி வடிவப் புத்தகங்களுக்கு குரல் கொடுத்திருக்கிறார், ஆவணப் படங்களில் குரல் வழி உயிர் கொடுத்திருக்கிறார்.

இவர் தன் எதிர்காலத்தை பாதுகாத்துக் கொள்ள சமீபத்தில் வாய்ஸ் குளோனிங் செய்திருப்பதாகக் கூறியுள்ளார்.

உதாரணமாக ஒரேநேரத்தில் இவருக்கு இரண்டு பணிகள் கிடைத்தால், ஓரிடத்தில் இவரும், மற்றோர் இடத்துக்கு இவர் தன் குரலையும் அனுப்பி பயன்படுத்திக் கொள்வார்.

ருபல் படேல்

பட மூலாதாரம், Rupal Patel

படக்குறிப்பு, ருபல் படேல்

தம் குரலை பிரதி எடுக்க டிம் ஹெல்லர் பாஸ்டனில் இருக்கும் வோகலிட் (VocaliD) என்கிற நிறுவனத்துக்குச் சென்றார். இது குரல் பிரதி எடுக்கும் தொழில்நுட்ப சேவையை வழங்கும் வளர்ந்து வரும் நிறுவனங்களில் ஒன்று.

இந்நிறுவனத்தை நார்த் ஈஸ்டர்ன் பல்கலைக்கழகத்தின் பேராசிரியர் ருபல் படேல் நிறுவியுள்ளார். அவரே இந்நிறுவனத்தின் முதன்மைச் செயல் அதிகாரியாகவும் பணிபுரிந்து வருகிறார். இவர் இந்த நிறுவனத்தை கடந்த 2014ஆம் ஆண்டு நிறுவினார்.

தானே கற்றுக் கொள்ளும், புதிய விஷயங்களை பழகிக் கொள்ளும் செயற்கை நுண்ணறிவு மற்றும் மென்பொருள் தொழில்நுட்பங்கள் கடந்த சில ஆண்டுகளில் பெரிதும் முன்னேறி இருக்கின்றன. இது குரல் வளக் கலைஞர்களின் கவனத்தையும் ஈர்த்திருக்கிறது என்கிறார் ருபல் படேல்.

"நாங்கள் பலதரப்பட்ட உச்சரிப்பு பாணிகளைக் கொண்ட குரல்களை உருவாக்குவதில் நிபுணத்துவம் பெற்றிருக்கிறோம்" என்கிறார் ருபல்.

"நாங்கள் சில மூன்றாம் பாலினத்தவர்களின் குரல்களை உருவாக்கியுள்ளோம், சில பாலின சமநிலை கொண்ட குரல்களை உருவாக்கியுள்ளோம். நாம் பேசுவதைப் போல தொழில்நுட்பமும் பேச வேண்டும். நம் அனைவருக்கும் ஒரு தனித்துவமான உச்சரிபுப் பாணிகளும் குரல் வளமும் இருக்கின்றன" என்கிறார் ருபல்.

இந்த வாய்ஸ் குளோனிங் வசதியைப் பயன்படுத்தி, ஒரு நடிகர் பேசும் வார்த்தைகளை மற்ற மொழிகளுக்கு மாற்றலாம். உதாரணமாக அமெரிக்க சினிமா தயாரிப்பு நிறுவனங்கள், இனி படத்தை மொழியாக்கம் செய்ய கூடுதலாக ஆட்களை வேலைக்கு எடுக்க வேண்டாம்.

பிரதி எடுக்கப்பட்ட ஆங்கில குரல்களை 15 வேறு மொழிகளில் மாற்ற முடியும் என கனடாவைச் சேர்ந்த ரிசெம்பிள் ஏஐ (Rsemble AI) என்கிற நிறுவனம் கூறுகிறது.

ஒரு தரமான குரல் பிரதியைத் தயாரிக்க, தங்கள் மென்பொருளுக்கு சுமார் 10 நிமிடம் பேசும் பதிவு போதுமானது என்கிறார் அந்நிறுவனத்தின் முதன்மைச் செயல் அதிகாரி சோஹைப் அஹ்மத்.

சோஹைப் அஹ்மத்

பட மூலாதாரம், ZOHAIB AHMED

படக்குறிப்பு, சோஹைப் அஹ்மத்

"உங்கள் குரல் பதிவை உள்வாங்கும் போது செயற்கை நுண்ணறிவு ஒரு குரலின் தீவிரத் தன்மை, பேசும் வேகம், குரலின் ஒலிப் பண்புகள் என ஆயிரக் கணக்கான பண்புகளை உள்வாங்கிக் கொள்கிறது" என்கிறார்.

டீப் ஃபேக் குற்றங்களுக்கு உதவலாம்

வாய்ஸ் குளோனிங்கில் பல்வேறு வணிக ரீதியிலான வாய்புகள் இருக்கிறதென்றாலும், இது போன்ற வாய்ஸ் குளோனிங் தொழில்நுட்பங்கள் சைபர் குற்றங்களுக்கு வழி வகுக்கலாம் என்கிற கவலையை ஏற்படுத்தி இருக்கிறது.

இது போன்ற குரல் பிரதிகளில் மிகப் பெரிய சைபர் பாதுகாப்பு அச்சுறுத்தல் இருப்பதாக சைபர் பாதுகாப்பு நிபுணர் எட்டி பாப்ரிட்ஸ்கி. கணினியில் உருவாக்கப்படும் போலி காணொளிகளைப் போல, வாய்ஸ் குளோனிங்குகளும் டீப் ஃபேக்தான்.

"மின்னஞ்சல் அல்லது எஸ் எம் எஸ் போன்றவைகளில் எளிதாக ஒருவருக்கு பதிலாக இன்னொருவர் ஆள்மாறாட்டம் செய்யலாம்" என்கிறார் மினர்வா லேப்ஸ் நிறுவனத்தின் தலைவர்

"நீங்கள் நம்பிக்கையோடு ஒருவரிடம் தொலைபேசியில் பேசுவது, அவரைக் குறித்து அதிகம் தெரிந்து கொள்வதுதான் இப்போது வரை ஒருவரை அடையாளம் காண்பதற்கான வழியாக இருக்கிறது."

இப்போது இது மாறிக் கொண்டிருக்கிறது என்கிறார் பாப்ரிட்ஸ்கி. "உதாரணமாக ஓர் ஊழியரை அழைத்து நிறுவனம் தொடர்பான முக்கிய விவரங்களை கேட்கிறார் என வைத்துக் கொள்வோம். அந்த ஊழியர் தன் முதலாளியின் குரலை அடையாளம் கண்டு கொண்டார் என்றால், அவர் கூறுவதை அப்படியே செய்வார். எனவே இது சைபர் குற்றங்களுக்கு வழிவகுக்கும்".

சைபர் தாக்குதல்

பட மூலாதாரம், Getty Images

இப்படி ஒரு குற்றம் சம்பவம் 2019ஆம் ஆண்டு நடந்ததாக வால் ஸ்ட்ரீட் ஜர்னல் பத்திரிகையில் செய்தியாக வெளியானது. பிரிட்டனைச் சேர்ந்த மேலாளர் ஒருவருக்கு, ஜெர்மனியைச் சேர்ந்த உயரதிகாரி ஒருவரின் குரல் பிரதியை வைத்து 2,60,000 அமெரிக்க டாலரை தங்கள் கணக்குக்கு அனுப்பும் படி மோசடிக்காரர்கள் கூறினார்கள்.

இது போன்ற பிரச்னைகளை சமாளிக்கும் விதத்தில் உலகம் முழழுக்க பல நிறுவனங்கள் பணியாற்றி வருகின்றன. வெஞ்சர் பீட் என்கிற நிறுவனம் அதில் ஒன்று.

இவர்களைப் போன்ற நிறுவனங்களால் ஒரு குரல் பதிவின் உண்மைத் தன்மையை ஆராய முடியும். ஒரு குரல் பதிவில் இருக்கும் டிஜிட்டல் இரைச்சல்கள், சில சொற்களின் பயன்பாடுகள் போன்றவைகளைக் கண்காணிக்கிறார்கள்.

அரசாங்கங்கள், சட்ட ஒழுங்கு அமைப்புகளும் இந்த பிரச்னையை கவனத்தில் எடுத்துக் கொண்டிருக்கிறார்கள். கடந்த ஆண்டு, டீப் ஃபேக்களை எதிர்கொள்ள தொழில்நுட்பத்தில் அதிகம் முதலீடு செய்ய அனைத்து உறுப்பு நாடுகளையும் வலியுறுத்தி இருக்கிறது யூரோபோல். அமெரிக்காவில் கலிஃபோர்னியா மாகாணத்தில் டீப் ஃபேக்களைப் பயன்படுத்த தடைவிதிக்கப்பட்டு இருக்கிறது.

சைபர் தாக்குதல்

பட மூலாதாரம், Getty Images

சரி மீண்டும் டெக்சாஸுக்குச் செல்வோம். டிம் ஹெல்லர் இன்னும் தன் குரல் பிரதியை யாருக்கும் விற்கவில்லை. ஆனால் சிலர் அதைப் பயன்படுத்த ஆர்வம் காட்டி இருக்கின்றனர் என்கிறார் டிம்.

இது போன்ற குரல் பிரதிகளால், நீண்ட காலத்தில் வேலை இழப்பு ஏற்படும் என பயப்படுகிறாரா அவர்?

"இது போன்ற தொழில்நுட்பங்கள் என் வேலைவாய்ப்புகளை பாதிக்கும் என நான் கவலைப்படவில்லை" என்கிறார். "எப்போதும் உண்மையான மனித குரல்களுக்கு இடமிருக்கும் என கருதுகிறேன். குரல் பிரதிகள் இருப்பது என்னை அல்லது எவரையும் மாற்றுவதற்கானதல்ல, என் தொழிலில் அதை ஒரு கூடுதல் சாதனமாகக் கருதுகிறேன்" என்கிறார்.

பிற செய்திகள்:

சமூக ஊடகங்களில் பிபிசி தமிழ் :