கூகுள் – ரெடிட் இடையே 60 மில்லியன் டாலர் ஏ.ஐ ஓப்பந்தம்; பதிப்புரிமையின் எதிர்காலமாக பார்க்கப்படுவது ஏன்?
கூகுள் – ரெடிட் இடையே 60 மில்லியன் டாலர் ஏ.ஐ ஓப்பந்தம்; சமூக ஊடக தளத்திலிருந்து நிகழ்நேர, கட்டமைக்கப்பட்ட, தனித்துவமான உள்ளடக்கத்தை வழங்கும் ரெடிட்-ன் தரவு பயன்பாட்டு நிரலாக்க இடைமுகத்தை (API) கூகுள் அணுகும்
கூகுள் மற்றும் ரெடிட் (Google-Reddit) 60 மில்லியன் டாலர் ஒப்பந்தத்தில் கையெழுத்திட்டுள்ளன, இது உலகில் அதிகம் பார்வையிடப்பட்ட சமூக ஊடகம் மற்றும் உள்ளடக்க பகிர்வு தளங்களில் ஒன்றான ரெடிட் தரவை இணைய தேடல் நிறுவனமான கூகுளுக்கு நிகழ்நேர அணுகலை வழங்கும். கூகுள் தனது செயற்கை நுண்ணறிவு (AI) சலுகைகளுக்கு இந்தத் தரவைப் பயன்படுத்தும்.
ரெடிட் (Reddit) வரவிருக்கும் வாரங்களில் ஒரு பொதுப் பட்டியலுக்குச் செல்லும், மேலும் இந்த நேரத்தில் பணத்தை உட்செலுத்துவது முதலீட்டாளர்களின் நம்பிக்கையை அதிகரிக்கும். கூகுளின் AI அமைப்பு அமெரிக்கா மற்றும் இந்தியா ஆகிய இரண்டிலும் பிரச்சனையில் சிக்கியுள்ளது மற்றும் நிறுவனம் அதன் சலுகைகளை மிகவும் நம்பகமானதாக மாற்ற விரும்புகிறது.
இணையத்தில் பயனர் உருவாக்கிய உள்ளடக்கத்தின் மதிப்பை இந்த ஒப்பந்தம் அடிக்கோடிட்டுக் காட்டுகிறது, குறிப்பாக கூகுளின் ஜெமினி மற்றும் ஓபன்.ஏ.ஐ.,யின் (OpenAI) சாட்.ஜி.பி.டி (ChatGPT) போன்ற ஜெனரேட்டிவ் ஏ.ஐ (GenAI) தளங்களுக்கு பொருந்தும். பெரிய மொழி மாதிரிகள் பயிற்றுவிப்பதில் உள்ள சிக்கல்களை இது சுட்டிக் காட்டுகிறது, அவை ஆன்லைனில் உள்ளடக்கத்தை உருவாக்குபவர்களின் அறிவுசார் சொத்துரிமைகளை மீறக்கூடும், மேலும் அத்தகைய உள்ளடக்க உரிம ஒப்பந்தங்கள் முக்கியமானதாக இருக்கலாம்.
Google-Reddit ஒப்பந்தத்தில் இருப்பது என்ன?
சமூக ஊடக தளத்திலிருந்து நிகழ்நேர, கட்டமைக்கப்பட்ட, தனித்துவமான உள்ளடக்கத்தை வழங்கும் Reddit இன் தரவு பயன்பாட்டு நிரலாக்க இடைமுகத்தை (API) Google அணுகும்.
"ரெடிட் டேட்டா ஏ.பி.ஐ மூலம், கூகுள் புதிய தகவலுக்கான திறமையான மற்றும் கட்டமைக்கப்பட்ட அணுகலைக் கொண்டிருக்கும், மேலும் Reddit உள்ளடக்கத்தை நன்றாகப் புரிந்துகொள்ளவும், காட்சிப்படுத்தவும், பயிற்சி செய்யவும் மற்றும் மிகவும் துல்லியமான மற்றும் பொருத்தமான வழிகளில் அதைப் பயன்படுத்த உதவும் மேம்படுத்தப்பட்ட சிக்னல்களை அணுகலாம்." என கூகுள் ஒரு வலைப்பதிவில் தெரிவித்துள்ளது.
கூகுளுக்கு இது ஏன் முக்கியமானது?
Google அதன் அடிப்படை மாதிரியை மிகவும் நம்பகமானதாகவும் துல்லியமாகவும் மாற்ற, முடிந்தவரை பயனர் உருவாக்கிய உள்ளடக்கத்தை அணுக வேண்டும். ஜெமினியால் உருவாக்கப்பட்ட பதில்கள் மீதான பரவலான விமர்சனம், நிறுவனம் ஒன்றிணைந்து செயல்படுவதற்கான அவசரத்தை அதிகரித்துள்ளது, ஏனெனில் OpenAI போன்றவை எதிர்காலத்தில் பயனர்கள் ஆன்லைன் சேவைகளை எவ்வாறு அணுகுகிறார்கள் என்பது குறித்து பெருகிய முறையில் கருத்து தெரிவிக்கும்.
இந்தியாவில் இணைய சேவையில் “மோடி ஒரு பாசிசவாதியா?” என்ற கேள்விக்கு பதிலளித்த ஜெமினி கூறுகையில், "பாசிச கொள்கைகள் என சில வல்லுநர்கள் வர்ணிக்கும் கொள்கைகளை அமல்படுத்தியதாக" பிரதமர் குற்றம் சாட்டப்பட்டுள்ளார், அதில் "பா.ஜ.கவின் இந்து தேசியவாத சித்தாந்தம், கருத்து வேறுபாடுகளை ஒடுக்குதல் மற்றும் மத சிறுபான்மையினருக்கு எதிரான வன்முறையைப் பயன்படுத்துதல்" ஆகியவை அடங்கும்,” எனத் தெரிவித்துள்ளது.
"சட்டவிரோதமான மற்றும் பிரச்சனைக்குரிய" பதில்களுக்கு ஷோ-காஸ் நோட்டீஸை வெளியிடுவதாக ஐ.டி அமைச்சகம் அச்சுறுத்தியதை அடுத்து, கூகுள் இந்தச் சிக்கலைத் தீர்த்துவிட்டதாகவும், அமைப்பை மேம்படுத்த வேலை செய்வதாகவும் கூறியது.
ஜெமினி வெள்ளை நபர்களை (அமெரிக்காவின் ஸ்தாபக தந்தைகள் போன்றவர்கள்) அல்லது நாஜி கால ஜெர்மன் வீரர்கள் போன்ற குழுக்களை நிறவெறி உடையவர்களாக சித்தரித்ததாக விமர்சனத்திற்குப் பிறகு, "சில வரலாற்றுப் படத் தலைமுறை சித்தரிப்புகளில் உள்ள தவறுகளுக்கு" நிறுவனம் முன்னதாக மன்னிப்பு கேட்டது.
Google-Reddit போன்ற உள்ளடக்க உரிம ஒப்பந்தங்கள் பெரிய மொழிகள் மாதிரிகளை உருவாக்குவதற்கான எதிர்காலமாகுமா?
நியூயார்க் டைம்ஸ் (NYT), பதிப்புரிமை பெற்ற உள்ளடக்கத்தை "சட்டவிரோதமாக" பயன்படுத்தியதாகக் கூறி, கடந்த ஆண்டு, ChatGPT மற்றும் பிற பிரபலமான AI இயங்குதளங்களை உருவாக்கிய OpenAI மற்றும் Microsoft மீது வழக்குத் தொடர்ந்தது. நிறுவனங்கள் தங்கள் மாதிரிகளை உருவாக்க மற்றும் பதில்களைத் தயாரிப்பதற்காக வெளியீட்டாளரிடமிருந்து அசல் உள்ளடக்கத்தை அகற்றுவதாக NYT அதன் வழக்கில் கூறியது.
NYT வழக்கு ஆன்லைன் உள்ளடக்கத்தின் உரிமை மற்றும் GenAI இயங்குதளங்கள் இணையத்தில் கணிசமான அளவு புதுப்பிக்கப்பட்ட மற்றும் பெரும்பாலும் துல்லியமான தகவல்கள், குறிப்பாக GenAI இயங்குதளங்கள் உண்மையில் பயனடையக்கூடிய தரவுகளை வெளியிடும் செய்தி வெளியீடுகள் போன்ற நிறுவனங்களின் அறிவுசார் சொத்துரிமை (IP) உரிமைகளை மீறுகின்றனவா என்ற விவாதத்தை மீண்டும் தூண்டியுள்ளது.
சாட்.ஜி.பி.டி மற்றும் ஜெமினி போன்ற AI இயங்குதளங்கள் உருவாக்கும் பதில்கள், செய்தி வெளியீட்டாளர்கள் உட்பட படைப்பாளிகள் ஆன்லைனில் பதிவேற்றிய மில்லியன் கணக்கான உரை உள்ளடக்கத்தின் அடித்தளத்தில் தங்கியுள்ளது.
IP உரிமைகளை நோக்கி மிகவும் உணர்திறன் வாய்ந்த இசை வணிகம், தொழில்துறையில் AI இன் பயன்பாட்டை பின்னுக்குத் தள்ளுகிறது. யுனிவர்சல் மியூசிக் குரூப், Spotify போன்ற ஸ்ட்ரீமிங் சேவைகளை புதிய பாடல்களை உருவாக்க AI போட்களுக்கு பயிற்சி அளிப்பதற்காக டெவலப்பர்கள் அதன் மெட்டீரியலை ஸ்கிராப் செய்வதைத் தடுக்குமாறு கேட்டுக் கொண்டுள்ளது.
இந்தியா உட்பட உலகெங்கிலும் உள்ள நாடுகளில் பதிப்புரிமைச் சட்டங்கள், AIயின் சகாப்தத்தில் கடுமையான மறுவடிவமைப்பு தேவை. இந்தியாவில், படைப்பாற்றல் படைப்புகள் 1957 ஆம் ஆண்டின் பதிப்புரிமைச் சட்டத்தால் கட்டுப்படுத்தப்படுகின்றன, இது "எழுத்தாளர்" (மற்றவற்றுடன்) "எந்தவொரு இலக்கிய, நாடக, இசை அல்லது கலைப் படைப்புகள் தொடர்பாக, கணினியால் உருவாக்கப்பட்ட, படைப்பை உருவாக்க காரணமான நபரை வரையறுக்கிறது."
இருப்பினும், இந்த வரையறையானது AI அமைப்புகள் தாங்களாகவே தகவல்களை உருவாக்குவதில்லை என்ற உண்மையை கணக்கில் எடுத்துக்கொள்ளவில்லை; அவர்கள் பயிற்றுவிக்கப்பட்ட அடிப்படை தரவுத்தொகுப்பைப் போலவே சிறந்ததாக இருக்கும். மேலும் அடிப்படை தரவுத்தொகுப்பு மற்ற ஆசிரியர்களால் தயாரிக்கப்பட்ட பதிப்புரிமை பெற்ற படைப்புகளிலிருந்து கட்டமைக்கப்பட்டுள்ளது.
“தமிழ் இந்தியன் எக்ஸ்பிரஸின் அனைத்து செய்திகளையும் உடனுக்குடன் டெலிகிராம் ஆப்பில் பெற https://t.me/ietamil“