ஆழ்போலித் தொழில்நுட்பத்தின் வளர்ச்சி

ஆழ்போலி (Deepfake) பற்றியும் ஆழ்போலிகளை உருவாக்கும் இரண்டு செயற்கை நுண்ணறிவு நிரல்களைப் (AI programmes) பற்றியும் ஏற்கனவே பார்த்தோம்.
அந்த இரண்டு செயற்கை நுண்ணறிவு நிரல்களும், உருவாக்கி (Generator) மற்றும் பிரித்துணரி (Discrimination) எனக் குறிப்பிட்டோம்.
இந்த இரண்டு AI நிரல்களும் ஒரு தொடர்ச்சியான ஊடாட்டத்தின் மூலம் ஒன்றையொன்று மேம்படுத்திக் கொள்கின்றன. அந்தவகையில் தான் இவை வடிவமைக்கப்பட்டுள்ளன.
ஆழக் கற்கும் முறை (Deep learning method)
இந்த AI நிரல்கள் எப்படி ஆழமாகக் கற்றுக் கொள்கின்றன என்பதைப் பற்றி இனிப் பார்ப்போம்.
தரவு சேகரிப்பு:
முதலில், பயிற்சி பெறுவதற்குத் தேவையான தரவுகள் செயற்கை நுண்ணறிவு நிரல் (AI Programmes) மூலம் சேகரிக்கப்படும். ஒரு குறிப்பிட்ட நபரின் ஆழ்போலியை உருவாக்குவதாக இருந்தால், அந்த நபரின் புகைப்படங்கள், காணொளிகள், குரல் பதிவுகள், முக அசைவுகள் மற்றும் பேச்சின் தனித்துவமான பாணிகள் போன்ற நுட்பமான அம்சங்கள் பெறப்படும். இதற்கு அந்த நபர் குறித்த ஏராளமான தரவுகள் தேவை. அவை சமூக ஊடகங்கள் மற்றும் பிற பொதுத் தளங்களிலிருந்து சேகரிக்கப்படுகின்றன. AI நிரல் எவ்வளவு அதிகமான மற்றும் உண்மையான தரவுகளிலிருந்து கற்றுக்கொள்ளுமோ, அவ்வளவுக்கு துல்லியமான ஆழ்போலியை அது உருவாக்கும்.
கற்றல்:
சேகரிக்கப்பட்ட இந்தத் தரவுகளைப் பயன்படுத்தி, செயற்கை நுண்ணறிவு நிரலானது குறித்த நபரின் முக அசைவுகள், குரலின் தனித்தன்மைகள் (timbre), உடல் மொழி, மற்றும் ஒளி-நிழல் மாற்றங்கள் போன்ற அனைத்து நுட்பமான அம்சங்களையும் ஆழ்ந்து கற்றுக்கொள்ளும். ஒரு மனிதன் ஒருவரை உற்றுநோக்கிக் கற்றுக்கொள்வது போன்று இங்கு AI நிரலும் கற்றுக் கொள்கிறது. ஆனால், இங்கு விஞ்ஞானபூர்மான, தரவுகளை அடிப்படையாகக் கொண்ட ஒரு கற்றல் முறை காணப்படுகிறது.
# உருவாக்கம்:
இந்த ஆழமான கற்றலின் அடிப்படையில், உருவாக்கி (Generator) யானது முற்றிலும் போலியான, புதிய உள்ளடக்கத்தை உருவாக்கும். ஏற்கனவே குறிப்பிட்டது போல, ஒரு நபர் இதற்கு முன் ஒருபோதும் சொல்லாத வார்த்தைகளை அவரது குரலிலும், அவரது முக அசைவுகளுடனும் பேசுவது போன்ற ஒரு காணொளியை இது உருவாக்கும். அவர் இருக்கும் சூழலும் கூட உண்மையான ஒரு சூழல் போல உருவாக்கும்.
மெருகூட்டல்:
உருவாக்கப்பட்ட உள்ளடக்கத்தை பிரித்துணரி (Discriminator) நன்கு ஆராயும். உண்மையுடன் ஒத்துச் செல்லாத அளவுக்கு ஏதும் போலியாக இருப்பதைக் கண்டறிந்தால் உடனே அது பின்னூட்டத்தை வழங்கும். உருவாக்கி (Generator) அந்தப் பின்னூட்டத்தைப் பயன்படுத்தி, அதனை மேலும் மெருகூட்டி, உண்மையாகத் தோன்றும் வரை மீண்டும் மீண்டும் திருத்தி மேம்படுத்தும். இந்தத் தொடர்ச்சியான பின்னூட்ட சுழற்சி மில்லியன் கணக்கான முறை நடைபெறுகிறது. இதன் விளைவாக, ஆழ்போலி செய்யப்பட்ட உள்ளடக்கத்தில் உள்ள உதட்டசைவுகள், குரலின் உண்மைத் தன்மை, முக பாவனைகள் ஆகியன மனிதக் கண்களுக்கும் காதுகளுக்கும் முற்றிலும் இயல்பானதாகவே தோன்றும். உண்மையென்றே நம்ப வைக்கும்.
தொழில்நுட்பத்தின் அதிவேக முன்னேற்றம்
வெறும் ஒரு ஆய்வகக் கருத்தாக ஆரம்பித்து, இன்று உலகெங்கிலும் உள்ள மில்லியன் கணக்கான மக்களின் கைபேசிகளை அடைந்த ஒரு வியத்தகு விடயம் தான் இந்த ஆழ்போலி (Deepfake) தொழில்நுட்பம். இதன் பரிணாம வளர்ச்சி, செயற்கை நுண்ணறிவின் அதிவேக முன்னேற்றத்தை எடுத்துக்காட்டுகிறது.
2000 களின் ஆரம்பத்தில், “ஆழக் கற்றல்” (Deep Learning) என்பது பெரும்பாலும் ஒரு கல்வி மற்றும் ஆய்வகக் கருத்தாகவே இருந்தது. ஆழ்போலி போன்ற உள்ளடக்கங்களை உருவாக்கும் ஆரம்பகட்ட முயற்சிகள் மிகவும் சிக்கலானவையாகவே காணப்பட்டன. அவற்றுக்கு ஆயிரக்கணக்கான உண்மையான படங்கள், காணொளிகள் போன்ற அடிப்படைத் தரவுகள் தேவைப்பட்டன. அதேபோன்று, அக்காலகட்டத்தில் கணினிகளின் செயலாக்கத் திறன்கள் மிகவும் குறைவாக இருந்ததால், அத்தகைய உள்ளடக்கங்களை உருவாக்க நாட்கள் பல செல்லும். சில போது பல வாரங்கள் கூட ஆகலாம். இதனால், இது பொது மக்களால் அணுக முடியாத, ஒரு குறிப்பிட்ட சில நிபுணர்களுக்கு மட்டுமே தெரிந்த விடயமாக இருந்தது.
2014 ஆம் ஆண்டு, இயன் குட்ஃபெலோ (Ian Goodfellow) மற்றும் அவரது குழுவினரால் ஜெனரேட்டிவ் எட்வர்சரியல் நெட்வேர்க்ஸ் (GANs) எனும் கட்டமைப்பு (Framework) அறிமுகப்படுத்தப்பட்டது. இது ஆழ்போலி தொழில்நுட்பத்தில் ஒரு புரட்சியை ஏற்படுத்தியது. GANs, போலித் தரவுகளை உருவாக்கும் AI மாதிரிகளுக்கு மிகவும் பயனுள்ள கட்டமைப்பை வழங்கியது. கூகுள் மற்றும் NVIDIA போன்ற பெரிய தொழில்நுட்ப நிறுவனங்கள் GANs ஆராய்ச்சிக்கு அதிக முக்கியத்துவம் அளித்தன. இது AI மாதிரிகளை மிகவும் திறன் வாய்ந்தவையாக மாற்றியது. ஆழ்போலி உருவாக்கத்தின் தரத்தை பல மடங்கு உயர்த்தியது. இருப்பினும், இந்த கால கட்டத்திலும் ஆழ்போலி உருவாக்கம் பெரும்பாலும் ஆய்வகங்களுக்குள்ளேயே, நிபுணர்களால் மட்டுமே கையாளப்பட்டது.
2017 ஆம் ஆண்டு, ஆழ்போலி பொதுப் பயன்பாட்டுக்கு மாறிய ஆண்டாகப் பரவலாகக் கருதப்படுகிறது. “Deepfake” என்ற சொல் அதே ஆண்டு ஒரு ரெடிட் (Reddit) சமூக ஊடக பயனரால் உருவாக்கப்பட்டது. அங்கு குறிப்பிட்ட சில பிரபலங்களின் போலியான வீடியோக்கள் பகிரப்பட்டன.
இதே காலகட்டத்தில், NVIDIA-இல் பணியாற்றிய மென்பொருள் வடிவமைப்பாளர் பிலிப் வாங் (Philip Wang) உருவாக்கிய “ThisPersonDoesNotExist.com” போன்ற இணையதளங்கள், AI மூலம் உருவாக்கப்பட்ட, உண்மையில் உலகில் இல்லாத மனித முகங்களைக் காட்டி, GANs-இன் ஆச்சரியப்படுத்தும் ஆற்றலை வெளிப்படுத்தின. இந்த நிகழ்வுகளே ஆழ்போலி தொழில்நுட்பத்தின் சக்தியை பொதுமக்களுக்கு உணர்த்தின.
2019 ஆம் ஆண்டு முதல் 2021 ஆம் ஆண்டுக்குள், ஆழ்போலி உருவாக்கம் பொதுமக்களுக்கும் எளிதாகக் கிடைத்தது. இக்காலப்பகுதியில் DeepFaceLab, FakeApp, FaceSwap போன்ற இலவச மற்றும் திறந்த மூல (open-source) மென்பொருட்கள் அறிமுகப்படுத்தப்பட்டன. இவை மேசைக் கணினிகளில் (Desktop) ஆழ்போலிக் காணொளிகளை உருவாக்கப் பயன்படுத்தப்பட்டன.
இதைத் தொடர்ந்து, Reface, FaceApp, Wombo, AI Time Machine போன்ற பல திறன்பேசி செயலிகள் (mobile apps) அறிமுகப்படுத்தப்பட்டன. இந்தச் செயலிகள், பயனர்கள் தங்கள் கைபேசியிலேயே சில வினாடிகளில் ஆழ்போலி படங்களையும், காணொளிகளையும், அசைவுருக்களையும் (Animation) உருவாக்க அனுமதித்தன. இது ஆழ்போலி உருவாக்கங்கள் கோடிக்கணக்கான மக்களைச் சென்றடைய வழிவகுத்தது.
இன்று நிலைமை மிகவும் மாறிவிட்டது. கூகுளின் Veo, RunwayML மற்றும் OpenAI யின் Sora AI போன்ற அதிநவீன AI கருவிகள் இப்போது பொதுமக்களுக்கு இலகுவாகக் கிடைக்கின்றன. இந்த மேம்பட்ட கருவிகளுக்கு, ஒரு புகைப்படம் அல்லது சில வினாடிகள் கொண்ட ஒரு குரல் மாதிரி இருந்தாலே போதுமானது. ஒருசில நிமிடங்களிலேயே உயர்தர ஆழ்போலிகளை உருவாக்கித் தந்துவிடும். அதிவேக கணினிகளின் பரவல் மற்றும் இணையத்தில் கிடைக்கும் எண்ணற்ற தரவுத் தொகுப்புகள் இந்த உருவாக்கச் செயல்முறையை மிகவும் எளிதாக்கியுள்ளன. இது ஆழ்போலி உருவாக்கத்திற்கான நுழைவுத் தடையை வெகுவாகக் குறைத்துள்ளது. இதனால் யாரும் எளிதாக இத்தகைய உள்ளடக்கங்களை உருவாக்க முடியும்.
இந்தக் கருவிகள் செயற்கை உள்ளடக்கத்தின் யதார்த்தத்தை அடுத்த நிலைக்கு எடுத்துச் சென்றுள்ளன. இது, ஆழ்போலி தொழில்நுட்பம் எவ்வளவு தூரம் பொதுமக்களைச் சென்றடைந்துவிட்டது என்பதையும், அதன் ஆற்றல் எவ்வளவு பெரிதாகிவிட்டது என்பதையும் தெளிவாகக் காட்டுகிறது.
![]()