Advertisment

வரிகளில் இருந்து வீடியோ உருவாக்கம்: ஒபன் ஏ.ஐ சோரா அறிமுகம்

நீங்கள் பார்க்க விரும்புவதைப் பற்றிய விளக்கத்தைத் தட்டச்சு செய்வதன் மூலம் ஒரு சிறிய அல்லது நீண்ட வீடியோவை உருவாக்க முடியும் என்று கற்பனை செய்து பாருங்கள்.

author-image
WebDesk
New Update
OpenAI launches Sora

பிப்ரவரி 3, 2023 இல் எடுக்கப்பட்ட இந்த விளக்கப்படத்தில் OpenAI லோகோ உள்ளது.

Listen to this article
0.75x 1x 1.5x
00:00 / 00:00

OpenAI launches Sora | Artificial Intelligence | சாட்ஜிபிடி (ChatGPT)-ஐ உருவாக்கிய ஓபன்ஏஐ (OpenAI) ஆனது, ஒரு புதிய ஜெனரேட்டிவ் செயற்கை நுண்ணறிவு (GenAI) மாதிரியை வெளியிட்டது.
இது ஒரு உரை வரியை வீடியோவாக மாற்ற முடியும், இது GenAI இன் ஒரு பகுதி இதுவரை முரண்பாடுகள் நிறைந்தது. சோரா எனப்படும் மாடல், காட்சி தரத்தை பராமரிக்கும் போது ஒரு நிமிடம் வரை வீடியோக்களை உருவாக்க முடியும் மற்றும் பயனரின் அறிவுறுத்தலுக்கு இணங்க ஓபன்ஏஐ தெரிவித்துள்ளது.

Advertisment

இது தொடர்பாக ஓபன்ஏஐ வலைப்பதிவில், "பல கதாபாத்திரங்கள், குறிப்பிட்ட வகையான இயக்கம் மற்றும் பொருள் மற்றும் பின்னணி பற்றிய துல்லியமான விவரங்கள் கொண்ட சிக்கலான காட்சிகளை" சோரா உருவாக்க முடியும். மேலும், முட்டுகளை துல்லியமாக விளக்கி, துடிப்பான உணர்ச்சிகளை வெளிப்படுத்தும் அழுத்தமான பாத்திரங்களை உருவாக்குகிறது என்பதை இந்த மாதிரியால் புரிந்து கொள்ள முடியும் என்றும் நிறுவனம் கூறியுள்ளது.

இருப்பினும், ஓபன்ஏஐ (OpenAI) ஆனது மாடல் சரியானதாக இருந்து வெகு தொலைவில் உள்ளது மற்றும் இன்னும் சிக்கலான தூண்டுதல்களுடன் போராடக்கூடும் என்று எச்சரித்துள்ளது. பொது மக்களுக்கு சோராவைத் தொடங்குவதற்கு முன், OpenAI ஆனது பாதுகாப்பு வல்லுநர்கள் மற்றும் கொள்கை வகுப்பாளர்களுடன் தனது அவுட்ரீச் திட்டத்தைத் தொடங்கும்.

ஏன் சோரா ஒரு பெரிய விஷயமாக இருக்க முடியும்?

கடந்த சில ஆண்டுகளில் GenAI இயங்குதளங்களில் படங்களின் உருவாக்கம் மற்றும் வாசக பதில்கள் குறிப்பிடத்தக்க வகையில் சிறப்பாக இருந்த நிலையில், டெக்ஸ்ட்-டு-வீடியோ என்பது முப்பரிமாண இடைவெளியில் நகரும் பொருட்களை பகுப்பாய்வு செய்வதில் கூடுதல் சிக்கலான காரணத்தால், பெரிதும் பின்தங்கியுள்ளது. .

வீடியோக்கள் படங்களின் வரிசையாக இருக்கும் அதே வேளையில், டெக்ஸ்ட்-டு-இமேஜ் ஜெனரேட்டர்கள் போன்ற சில அளவுருக்களைப் பயன்படுத்தி செயலாக்க முடியும், அவை அவற்றின் தனித்துவமான சவால்களையும் கொண்டுள்ளன.

"மொழியைப் பற்றிய ஆழமான புரிதலைக் கொண்டுள்ளது, இது தூண்டுதல்களைத் துல்லியமாக விளக்குகிறது. துடிப்பான உணர்ச்சிகளை வெளிப்படுத்தும் அழுத்தமான எழுத்துக்களை உருவாக்க உதவுகிறது. சோரா ஒரு வீடியோவில் பல காட்சிகளை உருவாக்க முடியும், அது துல்லியமாக எழுத்துக்கள் மற்றும் காட்சி பாணியைத் தொடரும்,” என்று ஓபன்ஏஐ தெரிவித்துள்ளது.

OpenAI தனது வலைப்பதிவு இடுகை மற்றும் சமூக ஊடகத் தளமான X இல் சோராவின் பணிக்கான பல எடுத்துக்காட்டுகளை வெளியிட்டது. ஒரு உதாரணம், "அழகான, பனி நிறைந்த டோக்கியோ நகரம் பரபரப்பாக உள்ளது. அழகான பனிமூட்டமான வானிலை மற்றும் அருகிலுள்ள ஸ்டால்களில் ஷாப்பிங் செய்வதை பலர் பின்தொடர்ந்து, பரபரப்பான நகரத் தெருவில் கேமரா நகர்கிறது. அழகான சகுரா இதழ்கள் ஸ்னோஃப்ளேக்குகளுடன் காற்றில் பறக்கின்றன.

மற்ற நிறுவனங்களும் டெக்ஸ்ட்-டு-வீடியோ விண்வெளியில் இறங்கியுள்ளன. கடந்த மாதம் அறிவிக்கப்பட்ட கூகுளின் லூமியர், கொடுக்கப்பட்ட வரியில் ஐந்து வினாடி வீடியோக்களை உரை மற்றும் பட அடிப்படையிலானதாக உருவாக்க முடியும். ரன்வே மற்றும் பிகா போன்ற பிற நிறுவனங்களும் தங்கள் சொந்த உரையிலிருந்து வீடியோ மாதிரிகளைக் காட்டியுள்ளன.

சோரா அனைவருக்கும் பயன்படுத்த கிடைக்குமா?

இதுவரை இல்லை. ஓபன்ஏஐயின் தயாரிப்புகளில் சோராவைக் கிடைக்கச் செய்வதற்கு முன்னதாக சில பாதுகாப்பு நடவடிக்கைகளை எடுப்பதாகவும், தவறான தகவல், வெறுக்கத்தக்க உள்ளடக்கம் மற்றும் பக்கச்சார்பு போன்ற பகுதிகளில் ரெட் டீமர்கள் டொமைன் நிபுணர்களுடன் இணைந்து செயல்படும் என்றும் நிறுவனம் கூறியுள்ளது.

படைப்பாற்றல் நிபுணர்களுக்கு மிகவும் உதவியாக இருக்கும் வகையில் மாடலை எவ்வாறு மேம்படுத்துவது என்பது குறித்த கருத்துக்களைப் பெற, பல காட்சி கலைஞர்கள், வடிவமைப்பாளர்கள் மற்றும் திரைப்படத் தயாரிப்பாளர்களுக்கு நிறுவனம் அணுகலை வழங்குகிறது.

“சோராவால் வீடியோ எப்போது உருவாக்கப்பட்டது என்பதைக் கண்டறியும் வகைப்படுத்தி போன்ற தவறான உள்ளடக்கத்தைக் கண்டறிய உதவும் கருவிகளையும் நாங்கள் உருவாக்கி வருகிறோம். OpenAI தயாரிப்பில் மாடலைப் பயன்படுத்தினால், எதிர்காலத்தில் C2PA மெட்டாடேட்டாவைச் சேர்க்க திட்டமிட்டுள்ளோம்,” என்று OpenAI கூறியது.

சோராவிற்கும் பொருந்தக்கூடிய DALL·E 3 ஐப் பயன்படுத்தும் அதன் தயாரிப்புகளில் இருக்கும் பாதுகாப்பு நெறிமுறைகளைப் பயன்படுத்துவதாக நிறுவனம் கூறுகிறது.

“OpenAI தயாரிப்பில் ஒருமுறை, தீவிர வன்முறை, பாலியல் உள்ளடக்கம், வெறுக்கத்தக்க படங்கள், பிரபலங்களின் தோற்றம் அல்லது பிறரின் IP போன்ற எங்கள் பயன்பாட்டுக் கொள்கைகளை மீறும் உரை உள்ளீட்டுத் தூண்டுதல்களை எங்கள் உரை வகைப்படுத்தி சரிபார்த்து நிராகரிக்கும்.

"உருவாக்கப்பட்ட ஒவ்வொரு வீடியோவின் பிரேம்களையும் மதிப்பாய்வு செய்யப் பயன்படும் வலுவான பட வகைப்படுத்திகளையும் நாங்கள் உருவாக்கியுள்ளோம், அது பயனருக்குக் காண்பிக்கப்படுவதற்கு முன்பு எங்கள் பயன்பாட்டுக் கொள்கைகளுக்கு இணங்குவதை உறுதிசெய்ய உதவும்" என்று அது கூறியது.

நிறுவனம் உலகெங்கிலும் உள்ள கொள்கை வகுப்பாளர்கள், கல்வியாளர்கள் மற்றும் கலைஞர்களுடன் "அவர்களின் கவலைகளைப் புரிந்துகொள்வதற்கும் இந்த புதிய தொழில்நுட்பத்திற்கான நேர்மறையான பயன்பாட்டு நிகழ்வுகளை அடையாளம் காண்பதற்கும் ஈடுபடும். விரிவான ஆராய்ச்சி மற்றும் சோதனைகள் இருந்தபோதிலும், மக்கள் எங்கள் தொழில்நுட்பத்தைப் பயன்படுத்தும் அனைத்து நன்மையான வழிகளையும் அல்லது மக்கள் அதை துஷ்பிரயோகம் செய்யும் அனைத்து வழிகளையும் எங்களால் கணிக்க முடியாது.

மாதிரியின் வெளிப்படையான குறைபாடுகள் உள்ளதா?

சோராவின் தற்போதைய மாடல் பலவீனங்களைக் கொண்டுள்ளது என்று OpenAI கூறுகிறது. இது ஒரு சிக்கலான காட்சியின் இயற்பியலை துல்லியமாக உருவகப்படுத்துவதில் சிரமப்படலாம், மேலும் காரணம் மற்றும் விளைவுகளின் குறிப்பிட்ட நிகழ்வுகளை புரிந்து கொள்ளாமல் போகலாம். உதாரணமாக, ஒரு நபர் குக்கீயில் இருந்து ஒரு கடியை எடுக்கலாம், ஆனால் அதன் பிறகு, குக்கீயில் கடி அடையாளம் இல்லாமல் இருக்கலாம்.

"உதாரணமாக, ஒரு ப்ராம்ட்டின் இடஞ்சார்ந்த விவரங்களையும் இந்த மாதிரி குழப்பலாம், எடுத்துக்காட்டாக, இடது மற்றும் வலது கலப்பு, மேலும் ஒரு குறிப்பிட்ட கேமரா பாதையைப் பின்பற்றுவது போன்ற காலப்போக்கில் நடக்கும் நிகழ்வுகளின் துல்லியமான விளக்கங்களுடன் போராடலாம்" என்று அது கூறியது.

ஆங்கிலத்தில் வாசிக்க : OpenAI launches Sora: How AI can create videos from a text prompt

“தமிழ் இந்தியன் எக்ஸ்பிரஸின் அனைத்து செய்திகளையும் உடனுக்குடன் டெலிகிராம் ஆப்பில் பெற https://t.me/ietamil“

Artificial Intelligence
Advertisment

Stay updated with the latest news headlines and all the latest Lifestyle news. Download Indian Express Tamil App - Android or iOS.

Follow us:
Advertisment