கூகுள் மற்றும் ரெடிட் (Google-Reddit) 60 மில்லியன் டாலர் ஒப்பந்தத்தில் கையெழுத்திட்டுள்ளன, இது உலகில் அதிகம் பார்வையிடப்பட்ட சமூக ஊடகம் மற்றும் உள்ளடக்க பகிர்வு தளங்களில் ஒன்றான ரெடிட் தரவை இணைய தேடல் நிறுவனமான கூகுளுக்கு நிகழ்நேர அணுகலை வழங்கும். கூகுள் தனது செயற்கை நுண்ணறிவு (AI) சலுகைகளுக்கு இந்தத் தரவைப் பயன்படுத்தும்.
ஆங்கிலத்தில் படிக்க: Why the $60 mn Google-Reddit AI deal foretells future of content licensing for LLMs
ரெடிட் (Reddit) வரவிருக்கும் வாரங்களில் ஒரு பொதுப் பட்டியலுக்குச் செல்லும், மேலும் இந்த நேரத்தில் பணத்தை உட்செலுத்துவது முதலீட்டாளர்களின் நம்பிக்கையை அதிகரிக்கும். கூகுளின் AI அமைப்பு அமெரிக்கா மற்றும் இந்தியா ஆகிய இரண்டிலும் பிரச்சனையில் சிக்கியுள்ளது மற்றும் நிறுவனம் அதன் சலுகைகளை மிகவும் நம்பகமானதாக மாற்ற விரும்புகிறது.
இணையத்தில் பயனர் உருவாக்கிய உள்ளடக்கத்தின் மதிப்பை இந்த ஒப்பந்தம் அடிக்கோடிட்டுக் காட்டுகிறது, குறிப்பாக கூகுளின் ஜெமினி மற்றும் ஓபன்.ஏ.ஐ.,யின் (OpenAI) சாட்.ஜி.பி.டி (ChatGPT) போன்ற ஜெனரேட்டிவ் ஏ.ஐ (GenAI) தளங்களுக்கு பொருந்தும். பெரிய மொழி மாதிரிகள் பயிற்றுவிப்பதில் உள்ள சிக்கல்களை இது சுட்டிக் காட்டுகிறது, அவை ஆன்லைனில் உள்ளடக்கத்தை உருவாக்குபவர்களின் அறிவுசார் சொத்துரிமைகளை மீறக்கூடும், மேலும் அத்தகைய உள்ளடக்க உரிம ஒப்பந்தங்கள் முக்கியமானதாக இருக்கலாம்.
Google-Reddit ஒப்பந்தத்தில் இருப்பது என்ன?
சமூக ஊடக தளத்திலிருந்து நிகழ்நேர, கட்டமைக்கப்பட்ட, தனித்துவமான உள்ளடக்கத்தை வழங்கும் Reddit இன் தரவு பயன்பாட்டு நிரலாக்க இடைமுகத்தை (API) Google அணுகும்.
"ரெடிட் டேட்டா ஏ.பி.ஐ மூலம், கூகுள் புதிய தகவலுக்கான திறமையான மற்றும் கட்டமைக்கப்பட்ட அணுகலைக் கொண்டிருக்கும், மேலும் Reddit உள்ளடக்கத்தை நன்றாகப் புரிந்துகொள்ளவும், காட்சிப்படுத்தவும், பயிற்சி செய்யவும் மற்றும் மிகவும் துல்லியமான மற்றும் பொருத்தமான வழிகளில் அதைப் பயன்படுத்த உதவும் மேம்படுத்தப்பட்ட சிக்னல்களை அணுகலாம்." என கூகுள் ஒரு வலைப்பதிவில் தெரிவித்துள்ளது.
கூகுளுக்கு இது ஏன் முக்கியமானது?
Google அதன் அடிப்படை மாதிரியை மிகவும் நம்பகமானதாகவும் துல்லியமாகவும் மாற்ற, முடிந்தவரை பயனர் உருவாக்கிய உள்ளடக்கத்தை அணுக வேண்டும். ஜெமினியால் உருவாக்கப்பட்ட பதில்கள் மீதான பரவலான விமர்சனம், நிறுவனம் ஒன்றிணைந்து செயல்படுவதற்கான அவசரத்தை அதிகரித்துள்ளது, ஏனெனில் OpenAI போன்றவை எதிர்காலத்தில் பயனர்கள் ஆன்லைன் சேவைகளை எவ்வாறு அணுகுகிறார்கள் என்பது குறித்து பெருகிய முறையில் கருத்து தெரிவிக்கும்.
இந்தியாவில் இணைய சேவையில் “மோடி ஒரு பாசிசவாதியா?” என்ற கேள்விக்கு பதிலளித்த ஜெமினி கூறுகையில், "பாசிச கொள்கைகள் என சில வல்லுநர்கள் வர்ணிக்கும் கொள்கைகளை அமல்படுத்தியதாக" பிரதமர் குற்றம் சாட்டப்பட்டுள்ளார், அதில் "பா.ஜ.கவின் இந்து தேசியவாத சித்தாந்தம், கருத்து வேறுபாடுகளை ஒடுக்குதல் மற்றும் மத சிறுபான்மையினருக்கு எதிரான வன்முறையைப் பயன்படுத்துதல்" ஆகியவை அடங்கும்,” எனத் தெரிவித்துள்ளது.
"சட்டவிரோதமான மற்றும் பிரச்சனைக்குரிய" பதில்களுக்கு ஷோ-காஸ் நோட்டீஸை வெளியிடுவதாக ஐ.டி அமைச்சகம் அச்சுறுத்தியதை அடுத்து, கூகுள் இந்தச் சிக்கலைத் தீர்த்துவிட்டதாகவும், அமைப்பை மேம்படுத்த வேலை செய்வதாகவும் கூறியது.
ஜெமினி வெள்ளை நபர்களை (அமெரிக்காவின் ஸ்தாபக தந்தைகள் போன்றவர்கள்) அல்லது நாஜி கால ஜெர்மன் வீரர்கள் போன்ற குழுக்களை நிறவெறி உடையவர்களாக சித்தரித்ததாக விமர்சனத்திற்குப் பிறகு, "சில வரலாற்றுப் படத் தலைமுறை சித்தரிப்புகளில் உள்ள தவறுகளுக்கு" நிறுவனம் முன்னதாக மன்னிப்பு கேட்டது.
Google-Reddit போன்ற உள்ளடக்க உரிம ஒப்பந்தங்கள் பெரிய மொழிகள் மாதிரிகளை உருவாக்குவதற்கான எதிர்காலமாகுமா?
நியூயார்க் டைம்ஸ் (NYT), பதிப்புரிமை பெற்ற உள்ளடக்கத்தை "சட்டவிரோதமாக" பயன்படுத்தியதாகக் கூறி, கடந்த ஆண்டு, ChatGPT மற்றும் பிற பிரபலமான AI இயங்குதளங்களை உருவாக்கிய OpenAI மற்றும் Microsoft மீது வழக்குத் தொடர்ந்தது. நிறுவனங்கள் தங்கள் மாதிரிகளை உருவாக்க மற்றும் பதில்களைத் தயாரிப்பதற்காக வெளியீட்டாளரிடமிருந்து அசல் உள்ளடக்கத்தை அகற்றுவதாக NYT அதன் வழக்கில் கூறியது.
NYT வழக்கு ஆன்லைன் உள்ளடக்கத்தின் உரிமை மற்றும் GenAI இயங்குதளங்கள் இணையத்தில் கணிசமான அளவு புதுப்பிக்கப்பட்ட மற்றும் பெரும்பாலும் துல்லியமான தகவல்கள், குறிப்பாக GenAI இயங்குதளங்கள் உண்மையில் பயனடையக்கூடிய தரவுகளை வெளியிடும் செய்தி வெளியீடுகள் போன்ற நிறுவனங்களின் அறிவுசார் சொத்துரிமை (IP) உரிமைகளை மீறுகின்றனவா என்ற விவாதத்தை மீண்டும் தூண்டியுள்ளது.
சாட்.ஜி.பி.டி மற்றும் ஜெமினி போன்ற AI இயங்குதளங்கள் உருவாக்கும் பதில்கள், செய்தி வெளியீட்டாளர்கள் உட்பட படைப்பாளிகள் ஆன்லைனில் பதிவேற்றிய மில்லியன் கணக்கான உரை உள்ளடக்கத்தின் அடித்தளத்தில் தங்கியுள்ளது.
IP உரிமைகளை நோக்கி மிகவும் உணர்திறன் வாய்ந்த இசை வணிகம், தொழில்துறையில் AI இன் பயன்பாட்டை பின்னுக்குத் தள்ளுகிறது. யுனிவர்சல் மியூசிக் குரூப், Spotify போன்ற ஸ்ட்ரீமிங் சேவைகளை புதிய பாடல்களை உருவாக்க AI போட்களுக்கு பயிற்சி அளிப்பதற்காக டெவலப்பர்கள் அதன் மெட்டீரியலை ஸ்கிராப் செய்வதைத் தடுக்குமாறு கேட்டுக் கொண்டுள்ளது.
இந்தியா உட்பட உலகெங்கிலும் உள்ள நாடுகளில் பதிப்புரிமைச் சட்டங்கள், AIயின் சகாப்தத்தில் கடுமையான மறுவடிவமைப்பு தேவை. இந்தியாவில், படைப்பாற்றல் படைப்புகள் 1957 ஆம் ஆண்டின் பதிப்புரிமைச் சட்டத்தால் கட்டுப்படுத்தப்படுகின்றன, இது "எழுத்தாளர்" (மற்றவற்றுடன்) "எந்தவொரு இலக்கிய, நாடக, இசை அல்லது கலைப் படைப்புகள் தொடர்பாக, கணினியால் உருவாக்கப்பட்ட, படைப்பை உருவாக்க காரணமான நபரை வரையறுக்கிறது."
இருப்பினும், இந்த வரையறையானது AI அமைப்புகள் தாங்களாகவே தகவல்களை உருவாக்குவதில்லை என்ற உண்மையை கணக்கில் எடுத்துக்கொள்ளவில்லை; அவர்கள் பயிற்றுவிக்கப்பட்ட அடிப்படை தரவுத்தொகுப்பைப் போலவே சிறந்ததாக இருக்கும். மேலும் அடிப்படை தரவுத்தொகுப்பு மற்ற ஆசிரியர்களால் தயாரிக்கப்பட்ட பதிப்புரிமை பெற்ற படைப்புகளிலிருந்து கட்டமைக்கப்பட்டுள்ளது.
“தமிழ் இந்தியன் எக்ஸ்பிரஸின் அனைத்து செய்திகளையும் உடனுக்குடன் டெலிகிராம் ஆப்பில் பெற https://t.me/ietamil“
Stay updated with the latest news headlines and all the latest Lifestyle news. Download Indian Express Tamil App - Android or iOS.