சாட் ஜி.பி.டி, ஜெமினி ஏ.ஐ சாட்போட்களின் முதுகெலும்பு: எல்.எல்.எம் என்றால் என்ன?

ஜெனரேட்டிவ் ஏ.ஐ மாதிரிகள் மனிதர்களுடன் "உரையாட" திறனை கொண்டு வர லார்ஜ் லேங்குவேஷ் மாடல் (எல்.எல்.எம்- LLM) எனப்படும் ஒன்று காரணமாகும். எல்.எல்.எம் பற்றி நீங்கள் தெரிந்து கொள்ள வேண்டிய அனைத்தும் இங்கே.

author-image
WebDesk
New Update
LLM.jpg
Listen to this article
0.75x 1x 1.5x
00:00 / 00:00

எல்.எல்.எம் என்றால் என்ன?

Advertisment

கூகிளின் கூற்றுப்படி, எல்.எல்.எம் (Large Language Model) பெரிய பொது-நோக்க மொழி மாதிரிகள் ஆகும், அவை முன் பயிற்சியளிக்கப்பட்டு பின்னர் குறிப்பிட்ட நோக்கங்களுக்காக நன்றாக வடிவமைக்கப்படுகிறது. 

எளிமையான வார்த்தைகளில், இந்த மாதிரிகள் உரை வகைப்பாடு, கேள்வி பதில், தொழில்கள் முழுவதும் உரை உருவாக்கம், ஆவணச் சுருக்கம் போன்ற பொதுவான மொழிப் பிரச்சனைகளைத் தீர்ப்பதற்குப் பயிற்றுவிக்கப்படுகின்றன. சில்லறை வணிகம், பொழுதுபோக்கு போன்றவை, ஒப்பீட்டளவில் சிறிய அளவிலான புல தரவுத்தொகுப்புகளைப் பயன்படுத்துகின்றன.

LLM களின் அர்த்தத்தை அதன் மூன்று முதன்மை அம்சங்களுடன் புரிந்து கொள்ள முடியும். முதலாவதாக, 'பெரியது' என்பது இரண்டு அர்த்தங்களைக் குறிக்கிறது - பயிற்சி தரவுகளின் மகத்தான அளவு; மற்றும் அளவுரு எண்ணிக்கை. இயந்திர கற்றலில், அளவுருக்கள், ஹைப்பர் பாராமீட்டர்கள் என்றும் அழைக்கப்படுகின்றன, அடிப்படையில் ஒரு இயந்திரம் அதன் மாதிரி பயிற்சியின் போது கற்றுக்கொண்ட நினைவுகள் மற்றும் அறிவு. ஒரு குறிப்பிட்ட சிக்கலைத் தீர்ப்பதில் மாதிரியின் திறனை அளவுருக்கள் வரையறுக்கின்றன.

Advertisment
Advertisements

எல்.எல்.எம் பற்றி புரிந்து கொள்ள வேண்டிய இரண்டாவது மிக முக்கியமான விஷயம் பொது நோக்கம். குறிப்பிட்ட பணிகள் மற்றும் வளக் கட்டுப்பாடுகளைப் பொருட்படுத்தாமல் மனித மொழியின் பொதுவான தன்மையை அடிப்படையாகக் கொண்ட பொதுவான சிக்கல்களைத் தீர்க்க மாதிரி போதுமானது.

சாராம்சத்தில், ஒரு எல்.எல்.எம் என்பது ஒரு சூப்பர் ஸ்மார்ட் கம்ப்யூட்டர் புரோகிராம் போன்றது, இது மனிதனைப் போன்ற உரையைப் புரிந்துகொண்டு உருவாக்க முடியும். இது பாரிய தரவுத் தொகுப்புகளில் பயிற்சியளிக்கப்படுகிறது, அவை அடிப்படையில் வடிவங்கள், கட்டமைப்புகள் மற்றும் மொழிகளுடனான உறவுகள். கணினிகள் மனித மொழியைப் புரிந்துகொள்ளவும் உற்பத்தி செய்யவும் உதவும் ஒரு கருவியாக LLM-க் காணலாம்.

எத்தனை வகையான எல்.எல்.எம்-கள் உள்ளன?

எல்.எல்.எம் பல்வேறு வகைகள் உள்ளன. அந்த வகை அவர்கள் செய்ய வேண்டிய பணிகளின் குறிப்பிட்ட அம்சத்தைப் பொறுத்தது என்பதைக் கவனத்தில் கொள்ள வேண்டும். கட்டிடக்கலை அடிப்படையில், மூன்று வகைகள் உள்ளன - தன்னியக்க, மின்மாற்றி அடிப்படையிலான மற்றும் குறியாக்கி-குறிவிலக்கி. GPT-3 என்பது ஒரு தன்னியக்க மாதிரியின் ஒரு எடுத்துக்காட்டு ஆகும், ஏனெனில் அவை முந்தைய சொற்களின் அடிப்படையில் ஒரு வரிசையில் அடுத்த வார்த்தையை கணிக்கின்றன. 

இதேபோல், LaMDA அல்லது ஜெமினி (முன்னர் பார்ட்) மொழி செயலாக்கத்திற்கு ஒரு குறிப்பிட்ட வகை நரம்பியல் நெட்வொர்க் கட்டமைப்பைப் பயன்படுத்துவதால் மின்மாற்றி அடிப்படையிலானது. குறியாக்கி-குறிவிலக்கி மாதிரிகள் உள்ளன, அவை உள்ளீட்டு உரையை பிரதிநிதித்துவத்தில் குறியாக்கம் செய்து பின்னர் அதை மற்றொரு மொழி அல்லது வடிவமைப்பில் குறியாக்கம் செய்கின்றன. 

பயிற்சித் தரவின் அடிப்படையில், மூன்று வகையான எல்.எல்.எம்கள் உள்ளன - முன் பயிற்சியளிக்கப்பட்ட மற்றும் நேர்த்தியான, பன்மொழி அல்லது பல மொழிகளில் உரையைப் புரிந்துகொண்டு உருவாக்கக்கூடிய மாதிரிகள், மற்றும் டொமைன் சார்ந்த அல்லது சட்டப்பூர்வ டொமைன்கள் தொடர்பான தரவுகளில் பயிற்சியளிக்கப்பட்ட மாதிரிகள், நிதி அல்லது சுகாதாரம்.

பெரிய மாடல்களுக்கு பொதுவாக அதிக கணக்கீட்டு ஆதாரங்கள் தேவைப்படுவதால், எல்எல்எம்கள் அவற்றின் அளவைப் பொறுத்து மாறுபடும். இருப்பினும், அவை சிறந்த செயல்திறனை வழங்குகின்றன.

சில இலவசமாகக் கிடைக்கின்றன, சில தனியுரிமமாக இருப்பதால், கிடைக்கும் தன்மையின் அடிப்படையில் அவை திறந்த மூலமாகவும், மூடிய மூலமாகவும் வகைப்படுத்தப்படலாம். LAMA2, BloOM, Google BERT, Falcon 180B, OPT-175 B ஆகியவை சில திறந்த மூல LLMகள், அதே சமயம் Claude 2, Bard, GPT-4, போன்ற சில தனியுரிம எல்.எல்.எம்களும் உள்ளன. 

எல்.எல்.எம் எவ்வாறு வேலை செய்கின்றன?

இது தொழில்நுட்ப அடிப்படையில் “deep learning” என்று அழைக்கப்படுகிறது. இது செயற்கை நரம்பியல் நெட்வொர்க்குகளின் பயிற்சியை உள்ளடக்கியது, அவை மனித மூளையின் கட்டமைப்பு மற்றும் செயல்பாடுகளால் ஈர்க்கப்பட்டதாக நம்பப்படும் கணித மாதிரிகள் ஆகும். LLMகளுக்கு, இந்த நரம்பியல் வலையமைப்பு ஒரு வார்த்தையின் நிகழ்தகவு அல்லது ஒரு வாக்கியத்தில் முந்தைய வார்த்தைகள் கொடுக்கப்பட்ட வார்த்தைகளின் வரிசையைக் கணிக்க கற்றுக்கொள்கிறது.

முன்னர் குறிப்பிட்டபடி, பயிற்சிக்காகப் பயன்படுத்தப்படும் தரவுத் தொகுப்பில் உள்ள சொற்களுக்கு இடையே உள்ள வடிவங்கள் மற்றும் உறவுகளை பகுப்பாய்வு செய்வதன் மூலம் இது செய்யப்படுகிறது. பயிற்சி பெற்றவுடன், ஒரு எல்எல்எம் அடுத்த வார்த்தை அல்லது ப்ராம்ப்ட்ஸ் எனப்படும் உள்ளீடுகளின் அடிப்படையில் வார்த்தைகளின் வரிசையை கணிக்க முடியும்.

ஒரு குழந்தை எப்படி பேசக் கற்றுக்கொள்கிறது என்பதைப் போலவே எல்.எல்.எம் கற்றல் திறனை சிறப்பாக விவரிக்க முடியும். நீங்கள் குழந்தைக்கு அறிவுறுத்தல் கையேட்டைக் கொடுக்கவில்லை, அம்மா, அப்பா பேசுவதைக் கேட்டு அவர் மொழியைப் கற்றுக்கொள்கிறார்.

எல்.எல்.எம் என்ன செய்ய முடியும்?

எல்எல்எம்கள் டொமைன்கள் முழுவதும் பயன்பாடுகளின் வரிசையுடன் வருகின்றன. அவை உரையை உருவாக்குகின்றன மற்றும் கதைகள் முதல் கட்டுரைகள் வரை கவிதை மற்றும் பாடல்கள் வரையிலான நோக்கங்களுக்காக மனிதனைப் போன்ற உள்ளடக்கத்தை உருவாக்கும் திறன் கொண்டவை. அவர்கள் உரையாடலைத் தொடங்கலாம் அல்லது மெய்நிகர் உதவியாளர்களாகச் செயல்படலாம். 

ஆங்கிலத்தில் படிக்க: https://indianexpress.com/article/explained/explained-sci-tech/what-is-an-llm-the-backbone-of-ai-chatbots-like-chatgpt-gemini-9180776/

எல்.எல்.எம் நன்மைகள் என்ன?

எல்.எல்.எம்களின் மிகப்பெரிய நன்மை அவற்றின் பல்துறை திறன் ஆகும். ஒரே மாதிரியை பலவிதமான பணிகளுக்குப் பயன்படுத்தலாம். அவை பெரிய தரவுத் தொகுப்புகளில் பயிற்றுவிக்கப்பட்டிருப்பதால், அவை வெவ்வேறு சிக்கல்கள் அல்லது பணிகளுக்குப் பயன்படுத்தக்கூடிய வடிவங்களைப் பொதுமைப்படுத்தும் திறன் கொண்டவை. 

தரவைப் பொறுத்தவரை, எல்.எல்.எம்கள் குறைந்த அளவு டொமைன் அல்லது தொழில்துறை சார்ந்த தரவுகளுடன் கூட சிறப்பாக செயல்பட முடியும் என்று கூறப்படுகிறது. எல்எல்எம்கள் பொது மொழிப் பயிற்சித் தரவுகளிலிருந்து அவர்கள் கற்றுக்கொண்ட அறிவைப் பயன்படுத்த முடியும் என்பதால் இது சாத்தியமாகும்.

மற்றொரு முக்கியமான அம்சம், அவர்களின் செயல்திறனை தொடர்ந்து மேம்படுத்துவதாகும். எல்எல்எம்களில் அதிக தரவு மற்றும் அளவுருக்கள் உட்செலுத்தப்படுவதால், அவற்றின் செயல்திறன் மேம்படும்.

“தமிழ் இந்தியன் எக்ஸ்பிரஸின் அனைத்து செய்திகளையும் உடனுக்குடன் டெலிகிராம் ஆப்பில் பெற https://t.me/ietamil

 

 

 

LLM

Stay updated with the latest news headlines and all the latest Lifestyle news. Download Indian Express Tamil App - Android or iOS.

Follow us: