OpenAI launches Sora | Artificial Intelligence | சாட்ஜிபிடி (ChatGPT)-ஐ உருவாக்கிய ஓபன்ஏஐ (OpenAI) ஆனது, ஒரு புதிய ஜெனரேட்டிவ் செயற்கை நுண்ணறிவு (GenAI) மாதிரியை வெளியிட்டது.
இது ஒரு உரை வரியை வீடியோவாக மாற்ற முடியும், இது GenAI இன் ஒரு பகுதி இதுவரை முரண்பாடுகள் நிறைந்தது. சோரா எனப்படும் மாடல், காட்சி தரத்தை பராமரிக்கும் போது ஒரு நிமிடம் வரை வீடியோக்களை உருவாக்க முடியும் மற்றும் பயனரின் அறிவுறுத்தலுக்கு இணங்க ஓபன்ஏஐ தெரிவித்துள்ளது.
இது தொடர்பாக ஓபன்ஏஐ வலைப்பதிவில், "பல கதாபாத்திரங்கள், குறிப்பிட்ட வகையான இயக்கம் மற்றும் பொருள் மற்றும் பின்னணி பற்றிய துல்லியமான விவரங்கள் கொண்ட சிக்கலான காட்சிகளை" சோரா உருவாக்க முடியும். மேலும், முட்டுகளை துல்லியமாக விளக்கி, துடிப்பான உணர்ச்சிகளை வெளிப்படுத்தும் அழுத்தமான பாத்திரங்களை உருவாக்குகிறது என்பதை இந்த மாதிரியால் புரிந்து கொள்ள முடியும் என்றும் நிறுவனம் கூறியுள்ளது.
இருப்பினும், ஓபன்ஏஐ (OpenAI) ஆனது மாடல் சரியானதாக இருந்து வெகு தொலைவில் உள்ளது மற்றும் இன்னும் சிக்கலான தூண்டுதல்களுடன் போராடக்கூடும் என்று எச்சரித்துள்ளது. பொது மக்களுக்கு சோராவைத் தொடங்குவதற்கு முன், OpenAI ஆனது பாதுகாப்பு வல்லுநர்கள் மற்றும் கொள்கை வகுப்பாளர்களுடன் தனது அவுட்ரீச் திட்டத்தைத் தொடங்கும்.
ஏன் சோரா ஒரு பெரிய விஷயமாக இருக்க முடியும்?
கடந்த சில ஆண்டுகளில் GenAI இயங்குதளங்களில் படங்களின் உருவாக்கம் மற்றும் வாசக பதில்கள் குறிப்பிடத்தக்க வகையில் சிறப்பாக இருந்த நிலையில், டெக்ஸ்ட்-டு-வீடியோ என்பது முப்பரிமாண இடைவெளியில் நகரும் பொருட்களை பகுப்பாய்வு செய்வதில் கூடுதல் சிக்கலான காரணத்தால், பெரிதும் பின்தங்கியுள்ளது. .
வீடியோக்கள் படங்களின் வரிசையாக இருக்கும் அதே வேளையில், டெக்ஸ்ட்-டு-இமேஜ் ஜெனரேட்டர்கள் போன்ற சில அளவுருக்களைப் பயன்படுத்தி செயலாக்க முடியும், அவை அவற்றின் தனித்துவமான சவால்களையும் கொண்டுள்ளன.
"மொழியைப் பற்றிய ஆழமான புரிதலைக் கொண்டுள்ளது, இது தூண்டுதல்களைத் துல்லியமாக விளக்குகிறது. துடிப்பான உணர்ச்சிகளை வெளிப்படுத்தும் அழுத்தமான எழுத்துக்களை உருவாக்க உதவுகிறது. சோரா ஒரு வீடியோவில் பல காட்சிகளை உருவாக்க முடியும், அது துல்லியமாக எழுத்துக்கள் மற்றும் காட்சி பாணியைத் தொடரும்,” என்று ஓபன்ஏஐ தெரிவித்துள்ளது.
OpenAI தனது வலைப்பதிவு இடுகை மற்றும் சமூக ஊடகத் தளமான X இல் சோராவின் பணிக்கான பல எடுத்துக்காட்டுகளை வெளியிட்டது. ஒரு உதாரணம், "அழகான, பனி நிறைந்த டோக்கியோ நகரம் பரபரப்பாக உள்ளது. அழகான பனிமூட்டமான வானிலை மற்றும் அருகிலுள்ள ஸ்டால்களில் ஷாப்பிங் செய்வதை பலர் பின்தொடர்ந்து, பரபரப்பான நகரத் தெருவில் கேமரா நகர்கிறது. அழகான சகுரா இதழ்கள் ஸ்னோஃப்ளேக்குகளுடன் காற்றில் பறக்கின்றன.
மற்ற நிறுவனங்களும் டெக்ஸ்ட்-டு-வீடியோ விண்வெளியில் இறங்கியுள்ளன. கடந்த மாதம் அறிவிக்கப்பட்ட கூகுளின் லூமியர், கொடுக்கப்பட்ட வரியில் ஐந்து வினாடி வீடியோக்களை உரை மற்றும் பட அடிப்படையிலானதாக உருவாக்க முடியும். ரன்வே மற்றும் பிகா போன்ற பிற நிறுவனங்களும் தங்கள் சொந்த உரையிலிருந்து வீடியோ மாதிரிகளைக் காட்டியுள்ளன.
சோரா அனைவருக்கும் பயன்படுத்த கிடைக்குமா?
இதுவரை இல்லை. ஓபன்ஏஐயின் தயாரிப்புகளில் சோராவைக் கிடைக்கச் செய்வதற்கு முன்னதாக சில பாதுகாப்பு நடவடிக்கைகளை எடுப்பதாகவும், தவறான தகவல், வெறுக்கத்தக்க உள்ளடக்கம் மற்றும் பக்கச்சார்பு போன்ற பகுதிகளில் ரெட் டீமர்கள் டொமைன் நிபுணர்களுடன் இணைந்து செயல்படும் என்றும் நிறுவனம் கூறியுள்ளது.
படைப்பாற்றல் நிபுணர்களுக்கு மிகவும் உதவியாக இருக்கும் வகையில் மாடலை எவ்வாறு மேம்படுத்துவது என்பது குறித்த கருத்துக்களைப் பெற, பல காட்சி கலைஞர்கள், வடிவமைப்பாளர்கள் மற்றும் திரைப்படத் தயாரிப்பாளர்களுக்கு நிறுவனம் அணுகலை வழங்குகிறது.
“சோராவால் வீடியோ எப்போது உருவாக்கப்பட்டது என்பதைக் கண்டறியும் வகைப்படுத்தி போன்ற தவறான உள்ளடக்கத்தைக் கண்டறிய உதவும் கருவிகளையும் நாங்கள் உருவாக்கி வருகிறோம். OpenAI தயாரிப்பில் மாடலைப் பயன்படுத்தினால், எதிர்காலத்தில் C2PA மெட்டாடேட்டாவைச் சேர்க்க திட்டமிட்டுள்ளோம்,” என்று OpenAI கூறியது.
சோராவிற்கும் பொருந்தக்கூடிய DALL·E 3 ஐப் பயன்படுத்தும் அதன் தயாரிப்புகளில் இருக்கும் பாதுகாப்பு நெறிமுறைகளைப் பயன்படுத்துவதாக நிறுவனம் கூறுகிறது.
“OpenAI தயாரிப்பில் ஒருமுறை, தீவிர வன்முறை, பாலியல் உள்ளடக்கம், வெறுக்கத்தக்க படங்கள், பிரபலங்களின் தோற்றம் அல்லது பிறரின் IP போன்ற எங்கள் பயன்பாட்டுக் கொள்கைகளை மீறும் உரை உள்ளீட்டுத் தூண்டுதல்களை எங்கள் உரை வகைப்படுத்தி சரிபார்த்து நிராகரிக்கும்.
"உருவாக்கப்பட்ட ஒவ்வொரு வீடியோவின் பிரேம்களையும் மதிப்பாய்வு செய்யப் பயன்படும் வலுவான பட வகைப்படுத்திகளையும் நாங்கள் உருவாக்கியுள்ளோம், அது பயனருக்குக் காண்பிக்கப்படுவதற்கு முன்பு எங்கள் பயன்பாட்டுக் கொள்கைகளுக்கு இணங்குவதை உறுதிசெய்ய உதவும்" என்று அது கூறியது.
நிறுவனம் உலகெங்கிலும் உள்ள கொள்கை வகுப்பாளர்கள், கல்வியாளர்கள் மற்றும் கலைஞர்களுடன் "அவர்களின் கவலைகளைப் புரிந்துகொள்வதற்கும் இந்த புதிய தொழில்நுட்பத்திற்கான நேர்மறையான பயன்பாட்டு நிகழ்வுகளை அடையாளம் காண்பதற்கும் ஈடுபடும். விரிவான ஆராய்ச்சி மற்றும் சோதனைகள் இருந்தபோதிலும், மக்கள் எங்கள் தொழில்நுட்பத்தைப் பயன்படுத்தும் அனைத்து நன்மையான வழிகளையும் அல்லது மக்கள் அதை துஷ்பிரயோகம் செய்யும் அனைத்து வழிகளையும் எங்களால் கணிக்க முடியாது.
மாதிரியின் வெளிப்படையான குறைபாடுகள் உள்ளதா?
சோராவின் தற்போதைய மாடல் பலவீனங்களைக் கொண்டுள்ளது என்று OpenAI கூறுகிறது. இது ஒரு சிக்கலான காட்சியின் இயற்பியலை துல்லியமாக உருவகப்படுத்துவதில் சிரமப்படலாம், மேலும் காரணம் மற்றும் விளைவுகளின் குறிப்பிட்ட நிகழ்வுகளை புரிந்து கொள்ளாமல் போகலாம். உதாரணமாக, ஒரு நபர் குக்கீயில் இருந்து ஒரு கடியை எடுக்கலாம், ஆனால் அதன் பிறகு, குக்கீயில் கடி அடையாளம் இல்லாமல் இருக்கலாம்.
"உதாரணமாக, ஒரு ப்ராம்ட்டின் இடஞ்சார்ந்த விவரங்களையும் இந்த மாதிரி குழப்பலாம், எடுத்துக்காட்டாக, இடது மற்றும் வலது கலப்பு, மேலும் ஒரு குறிப்பிட்ட கேமரா பாதையைப் பின்பற்றுவது போன்ற காலப்போக்கில் நடக்கும் நிகழ்வுகளின் துல்லியமான விளக்கங்களுடன் போராடலாம்" என்று அது கூறியது.
ஆங்கிலத்தில் வாசிக்க : OpenAI launches Sora: How AI can create videos from a text prompt
“தமிழ் இந்தியன் எக்ஸ்பிரஸின் அனைத்து செய்திகளையும் உடனுக்குடன் டெலிகிராம் ஆப்பில் பெற https://t.me/ietamil“
Stay updated with the latest news headlines and all the latest Lifestyle news. Download Indian Express Tamil App - Android or iOS.