Advertisment

சாட் ஜி.பி.டி, ஜெமினி ஏ.ஐ சாட்போட்களின் முதுகெலும்பு: எல்.எல்.எம் என்றால் என்ன?

ஜெனரேட்டிவ் ஏ.ஐ மாதிரிகள் மனிதர்களுடன் "உரையாட" திறனை கொண்டு வர லார்ஜ் லேங்குவேஷ் மாடல் (எல்.எல்.எம்- LLM) எனப்படும் ஒன்று காரணமாகும். எல்.எல்.எம் பற்றி நீங்கள் தெரிந்து கொள்ள வேண்டிய அனைத்தும் இங்கே.

author-image
WebDesk
New Update
LLM.jpg
Listen to this article
0.75x 1x 1.5x
00:00 / 00:00

எல்.எல்.எம் என்றால் என்ன?

Advertisment

கூகிளின் கூற்றுப்படி, எல்.எல்.எம் (Large Language Model) பெரிய பொது-நோக்க மொழி மாதிரிகள் ஆகும், அவை முன் பயிற்சியளிக்கப்பட்டு பின்னர் குறிப்பிட்ட நோக்கங்களுக்காக நன்றாக வடிவமைக்கப்படுகிறது. 

எளிமையான வார்த்தைகளில், இந்த மாதிரிகள் உரை வகைப்பாடு, கேள்வி பதில், தொழில்கள் முழுவதும் உரை உருவாக்கம், ஆவணச் சுருக்கம் போன்ற பொதுவான மொழிப் பிரச்சனைகளைத் தீர்ப்பதற்குப் பயிற்றுவிக்கப்படுகின்றன. சில்லறை வணிகம், பொழுதுபோக்கு போன்றவை, ஒப்பீட்டளவில் சிறிய அளவிலான புல தரவுத்தொகுப்புகளைப் பயன்படுத்துகின்றன.

LLM களின் அர்த்தத்தை அதன் மூன்று முதன்மை அம்சங்களுடன் புரிந்து கொள்ள முடியும். முதலாவதாக, 'பெரியது' என்பது இரண்டு அர்த்தங்களைக் குறிக்கிறது - பயிற்சி தரவுகளின் மகத்தான அளவு; மற்றும் அளவுரு எண்ணிக்கை. இயந்திர கற்றலில், அளவுருக்கள், ஹைப்பர் பாராமீட்டர்கள் என்றும் அழைக்கப்படுகின்றன, அடிப்படையில் ஒரு இயந்திரம் அதன் மாதிரி பயிற்சியின் போது கற்றுக்கொண்ட நினைவுகள் மற்றும் அறிவு. ஒரு குறிப்பிட்ட சிக்கலைத் தீர்ப்பதில் மாதிரியின் திறனை அளவுருக்கள் வரையறுக்கின்றன.

எல்.எல்.எம் பற்றி புரிந்து கொள்ள வேண்டிய இரண்டாவது மிக முக்கியமான விஷயம் பொது நோக்கம். குறிப்பிட்ட பணிகள் மற்றும் வளக் கட்டுப்பாடுகளைப் பொருட்படுத்தாமல் மனித மொழியின் பொதுவான தன்மையை அடிப்படையாகக் கொண்ட பொதுவான சிக்கல்களைத் தீர்க்க மாதிரி போதுமானது.

சாராம்சத்தில், ஒரு எல்.எல்.எம் என்பது ஒரு சூப்பர் ஸ்மார்ட் கம்ப்யூட்டர் புரோகிராம் போன்றது, இது மனிதனைப் போன்ற உரையைப் புரிந்துகொண்டு உருவாக்க முடியும். இது பாரிய தரவுத் தொகுப்புகளில் பயிற்சியளிக்கப்படுகிறது, அவை அடிப்படையில் வடிவங்கள், கட்டமைப்புகள் மற்றும் மொழிகளுடனான உறவுகள். கணினிகள் மனித மொழியைப் புரிந்துகொள்ளவும் உற்பத்தி செய்யவும் உதவும் ஒரு கருவியாக LLM-க் காணலாம்.

எத்தனை வகையான எல்.எல்.எம்-கள் உள்ளன?

எல்.எல்.எம் பல்வேறு வகைகள் உள்ளன. அந்த வகை அவர்கள் செய்ய வேண்டிய பணிகளின் குறிப்பிட்ட அம்சத்தைப் பொறுத்தது என்பதைக் கவனத்தில் கொள்ள வேண்டும். கட்டிடக்கலை அடிப்படையில், மூன்று வகைகள் உள்ளன - தன்னியக்க, மின்மாற்றி அடிப்படையிலான மற்றும் குறியாக்கி-குறிவிலக்கி. GPT-3 என்பது ஒரு தன்னியக்க மாதிரியின் ஒரு எடுத்துக்காட்டு ஆகும், ஏனெனில் அவை முந்தைய சொற்களின் அடிப்படையில் ஒரு வரிசையில் அடுத்த வார்த்தையை கணிக்கின்றன. 

இதேபோல், LaMDA அல்லது ஜெமினி (முன்னர் பார்ட்) மொழி செயலாக்கத்திற்கு ஒரு குறிப்பிட்ட வகை நரம்பியல் நெட்வொர்க் கட்டமைப்பைப் பயன்படுத்துவதால் மின்மாற்றி அடிப்படையிலானது. குறியாக்கி-குறிவிலக்கி மாதிரிகள் உள்ளன, அவை உள்ளீட்டு உரையை பிரதிநிதித்துவத்தில் குறியாக்கம் செய்து பின்னர் அதை மற்றொரு மொழி அல்லது வடிவமைப்பில் குறியாக்கம் செய்கின்றன. 

பயிற்சித் தரவின் அடிப்படையில், மூன்று வகையான எல்.எல்.எம்கள் உள்ளன - முன் பயிற்சியளிக்கப்பட்ட மற்றும் நேர்த்தியான, பன்மொழி அல்லது பல மொழிகளில் உரையைப் புரிந்துகொண்டு உருவாக்கக்கூடிய மாதிரிகள், மற்றும் டொமைன் சார்ந்த அல்லது சட்டப்பூர்வ டொமைன்கள் தொடர்பான தரவுகளில் பயிற்சியளிக்கப்பட்ட மாதிரிகள், நிதி அல்லது சுகாதாரம்.

பெரிய மாடல்களுக்கு பொதுவாக அதிக கணக்கீட்டு ஆதாரங்கள் தேவைப்படுவதால், எல்எல்எம்கள் அவற்றின் அளவைப் பொறுத்து மாறுபடும். இருப்பினும், அவை சிறந்த செயல்திறனை வழங்குகின்றன.

சில இலவசமாகக் கிடைக்கின்றன, சில தனியுரிமமாக இருப்பதால், கிடைக்கும் தன்மையின் அடிப்படையில் அவை திறந்த மூலமாகவும், மூடிய மூலமாகவும் வகைப்படுத்தப்படலாம். LAMA2, BloOM, Google BERT, Falcon 180B, OPT-175 B ஆகியவை சில திறந்த மூல LLMகள், அதே சமயம் Claude 2, Bard, GPT-4, போன்ற சில தனியுரிம எல்.எல்.எம்களும் உள்ளன. 

எல்.எல்.எம் எவ்வாறு வேலை செய்கின்றன?

இது தொழில்நுட்ப அடிப்படையில் “deep learning” என்று அழைக்கப்படுகிறது. இது செயற்கை நரம்பியல் நெட்வொர்க்குகளின் பயிற்சியை உள்ளடக்கியது, அவை மனித மூளையின் கட்டமைப்பு மற்றும் செயல்பாடுகளால் ஈர்க்கப்பட்டதாக நம்பப்படும் கணித மாதிரிகள் ஆகும். LLMகளுக்கு, இந்த நரம்பியல் வலையமைப்பு ஒரு வார்த்தையின் நிகழ்தகவு அல்லது ஒரு வாக்கியத்தில் முந்தைய வார்த்தைகள் கொடுக்கப்பட்ட வார்த்தைகளின் வரிசையைக் கணிக்க கற்றுக்கொள்கிறது.

முன்னர் குறிப்பிட்டபடி, பயிற்சிக்காகப் பயன்படுத்தப்படும் தரவுத் தொகுப்பில் உள்ள சொற்களுக்கு இடையே உள்ள வடிவங்கள் மற்றும் உறவுகளை பகுப்பாய்வு செய்வதன் மூலம் இது செய்யப்படுகிறது. பயிற்சி பெற்றவுடன், ஒரு எல்எல்எம் அடுத்த வார்த்தை அல்லது ப்ராம்ப்ட்ஸ் எனப்படும் உள்ளீடுகளின் அடிப்படையில் வார்த்தைகளின் வரிசையை கணிக்க முடியும்.

ஒரு குழந்தை எப்படி பேசக் கற்றுக்கொள்கிறது என்பதைப் போலவே எல்.எல்.எம் கற்றல் திறனை சிறப்பாக விவரிக்க முடியும். நீங்கள் குழந்தைக்கு அறிவுறுத்தல் கையேட்டைக் கொடுக்கவில்லை, அம்மா, அப்பா பேசுவதைக் கேட்டு அவர் மொழியைப் கற்றுக்கொள்கிறார்.

எல்.எல்.எம் என்ன செய்ய முடியும்?

எல்எல்எம்கள் டொமைன்கள் முழுவதும் பயன்பாடுகளின் வரிசையுடன் வருகின்றன. அவை உரையை உருவாக்குகின்றன மற்றும் கதைகள் முதல் கட்டுரைகள் வரை கவிதை மற்றும் பாடல்கள் வரையிலான நோக்கங்களுக்காக மனிதனைப் போன்ற உள்ளடக்கத்தை உருவாக்கும் திறன் கொண்டவை. அவர்கள் உரையாடலைத் தொடங்கலாம் அல்லது மெய்நிகர் உதவியாளர்களாகச் செயல்படலாம். 

ஆங்கிலத்தில் படிக்க: https://indianexpress.com/article/explained/explained-sci-tech/what-is-an-llm-the-backbone-of-ai-chatbots-like-chatgpt-gemini-9180776/

எல்.எல்.எம் நன்மைகள் என்ன?

எல்.எல்.எம்களின் மிகப்பெரிய நன்மை அவற்றின் பல்துறை திறன் ஆகும். ஒரே மாதிரியை பலவிதமான பணிகளுக்குப் பயன்படுத்தலாம். அவை பெரிய தரவுத் தொகுப்புகளில் பயிற்றுவிக்கப்பட்டிருப்பதால், அவை வெவ்வேறு சிக்கல்கள் அல்லது பணிகளுக்குப் பயன்படுத்தக்கூடிய வடிவங்களைப் பொதுமைப்படுத்தும் திறன் கொண்டவை. 

தரவைப் பொறுத்தவரை, எல்.எல்.எம்கள் குறைந்த அளவு டொமைன் அல்லது தொழில்துறை சார்ந்த தரவுகளுடன் கூட சிறப்பாக செயல்பட முடியும் என்று கூறப்படுகிறது. எல்எல்எம்கள் பொது மொழிப் பயிற்சித் தரவுகளிலிருந்து அவர்கள் கற்றுக்கொண்ட அறிவைப் பயன்படுத்த முடியும் என்பதால் இது சாத்தியமாகும்.

மற்றொரு முக்கியமான அம்சம், அவர்களின் செயல்திறனை தொடர்ந்து மேம்படுத்துவதாகும். எல்எல்எம்களில் அதிக தரவு மற்றும் அளவுருக்கள் உட்செலுத்தப்படுவதால், அவற்றின் செயல்திறன் மேம்படும்.

“தமிழ் இந்தியன் எக்ஸ்பிரஸின் அனைத்து செய்திகளையும் உடனுக்குடன் டெலிகிராம் ஆப்பில் பெற https://t.me/ietamil

 

 

 

LLM
Advertisment

Stay updated with the latest news headlines and all the latest Lifestyle news. Download Indian Express Tamil App - Android or iOS.

Follow us:
Advertisment