ഇക്കാലത്തെ ഒരു തരംഗമാണ് ലാർജ് ലാംഗ്വേജ് മോഡലുകൾ (Large Language Models – LLMs) എന്ന എ ഐ സാങ്കേതികവിദ്യ. ഏവർക്കും സുപരിചിതമായ ചാറ്റ് ജിപിടി, ക്ലോഡ്, ജെമിനി തുടങ്ങിയ ആപ്പുകൾ വഴി നമുക്ക് പരിചിതമായിത്തീർന്ന ഈ സാങ്കേതികവിദ്യ എങ്ങനെ വികസിച്ചു, ഇന്ന് എവിടെ എത്തി നിൽക്കുന്നു എന്ന ഒരന്വേഷണമാണ് ഈ ലേഖനം.
ആമുഖം
ഇന്ന് നമുക്കു ചുറ്റും കാണുന്ന നിർമിതബുദ്ധി സാങ്കേതികവിദ്യ ഏതാണ്ട് അഞ്ച് വർഷം മാത്രം പഴക്കമുള്ളതാണ് എന്നാണ് പൊതുബോധം. എന്നാലിത് ഒരു ആശയമെന്ന നിലയിൽ നൂറ്റാണ്ടുകളും, പ്രായോഗിക തലത്തിൽ ഏതാണ്ട് മുക്കാൽ നൂറ്റാണ്ടും പഴക്കമുള്ളതാണ്. എന്നിരിക്കിലും അതിന്റെ ദൈനംദിന ജീവിതത്തിലെ പ്രായോഗികത കാണാൻ 2010നു ശേഷമുണ്ടായ മികച്ച അൽഗോരിതങ്ങൾ, ശക്തിയേറിയ കമ്പ്യൂട്ടറുകൾ, വലിയ അളവിൽ ലഭ്യമായ ഡാറ്റ ഉപയോഗിച്ചുള്ള പരിശീലനം എന്നിവ വേണ്ടിവന്നു എന്നതാണ് ഈ പൊതുബോധ നിർമാണത്തിന്റെ അടിസ്ഥാനം.
വലിയ ഭാഷാമാതൃകകളുടെ വികാസക്രമം
ലാർജ് ലാംഗ്വേജ് മോഡലുകളുടെ കഥ തുടങ്ങുന്നത് കമ്പ്യൂട്ടറുകളെ മനുഷ്യന്റെ ഭാഷ മനസ്സിലാക്കാൻ പഠിപ്പിക്കാനുള്ള ശ്രമത്തിൽ നിന്നാണ്. മനുഷ്യ ഭാഷകൾ മനസ്സിലാക്കാൻ ശ്രമിക്കുന്ന നിർമിതബുദ്ധി ശാഖയായ നാച്ചുറൽ ലാംഗ്വേജ് പ്രോസസിംഗ് (NLP) മേഖലയിലെ ആദ്യകാല ശ്രമങ്ങൾ വളരെ ലളിതമായിരുന്നു. ഇംഗ്ലീഷ് പോലുള്ള ഭാഷകളിലെ നിയമങ്ങൾ അടിസ്ഥാനമാക്കി പ്രവർത്തിക്കുന്ന സങ്കേതങ്ങൾ ആയിരുന്നു ഇവ. എന്നാൽ 2017-ൽ ഗൂഗിൾ ഗവേഷണശാലയിൽ നിന്ന് പുറത്തുവന്ന “ട്രാൻസ്ഫോർമർ” എന്ന മോഡൽ ഈ മേഖലയിൽ യഥാർത്ഥ വിപ്ലവം സൃഷ്ടിച്ചു. “Attention Is All You Need” എന്നായിരുന്നു ഇവർ പ്രസിദ്ധീകരിച്ച പ്രബന്ധത്തിന്റെ തലക്കെട്ട്.
ട്രാൻസ്ഫോർമർ മാതൃകകൾ “അറ്റൻഷൻ” എന്ന സംവിധാനം ഉപയോഗിച്ച് ഒരു വാക്യത്തിലെ ഓരോ വാക്കും മറ്റ് വാക്കുകളുമായി എങ്ങനെ ബന്ധപ്പെട്ടിരിക്കുന്നു എന്ന് മനസ്സിലാക്കുന്നു. ഇത് മനുഷ്യന്റെ ശ്രദ്ധയുടെ രീതിയോട് സാമ്യമുള്ളതാണ്. ഈ അടിസ്ഥാന സാങ്കേതികവിദ്യയിലാണ് മേൽ സൂചിപ്പിച്ച എല്ലാ എ ഐ മാതൃകകളും നിർമിച്ചിരിക്കുന്നത്. എന്നിരിക്കിലും എ ഐ സാങ്കേതികവിദ്യയിൽ ഈ മാതൃകകൾ ഉപയോഗിക്കുന്ന മേഖലയായ ജനറേറ്റീവ് എ ഐയ്ക്ക് പരമാവധി പതിനഞ്ച് ശതമാനത്തിൽ താഴെയേ പങ്കുള്ളൂ എന്നത് ശ്രദ്ധേയമാണ്. എ ഐ ഉപയോഗങ്ങളിൽ ഏതാണ്ട് 70-–80 ശതമാനം പ്രെഡിക്ടീവ് എ ഐ അല്ലെങ്കിൽ ഡിസ്ക്രിമിനേറ്റീവ് എ ഐ എന്നൊക്കെ വിളിക്കാവുന്ന പരമ്പരാഗതമായി പ്രചാരത്തിലുള്ള റൂൾ ബേസ്ഡ് എ ഐ ആണ്.
ട്രാൻസ്ഫോർമർ മോഡലിന്റെ പ്രവർത്തനം
ട്രാൻസ്ഫോർമറുകൾ അഥവാ ട്രാൻസ്ഫോർമർ ന്യൂറൽ നെറ്റ്വർക്കുകൾ എന്ന സാങ്കേതികവിദ്യ ഉപയോഗിച്ചാണ് ലാർജ് ലാംഗ്വേജ് മോഡലുകൾ പ്രവർത്തിക്കുന്നത്. ഒരു വാക്യത്തിലെ വാക്കുകൾക്കിടയിലുള്ള സന്ദർഭം മനസ്സിലാക്കാനും ഒരു ഔട്ട്പുട്ട് വാക്യത്തിലെ അടുത്തത് അല്ലെങ്കിൽ പ്രതീക്ഷിക്കുന്ന വാക്ക് പ്രവചിക്കാനും അവയ്ക്ക് കഴിയും. അങ്ങനെയാണ് ChatGPT-യും മറ്റ് LLM-കളും വാക്കുകൾ തുടർച്ചയായി സൃഷ്ടിക്കുന്നത്. ഇതിൽ ഉപയോഗിക്കുന്ന സങ്കീർണമായ ന്യൂറൽ നെറ്റ്വർക്കുകൾ ഇൻപുട്ട് വാക്യത്തെ അടിസ്ഥാനമാക്കി അടുത്ത വാക്ക് ഘട്ടംഘട്ടമായി സൃഷ്ടിക്കുകയോ പ്രവചിക്കുകയോ ചെയ്യുന്നു.
ഉദാഹരണത്തിന്, നമ്മൾ ‘Thank You’ എന്ന ഒരു വാചകം നൽകുകയാണെങ്കിൽ, എൽഎൽഎം ‘You are welcome’ എന്ന് പറയണം. അതിനായി അത് അൽഗോരിതങ്ങൾ ഉപയോഗിച്ച് ആദ്യത്തെ വാക്ക് ‘You’ എന്നും തുടർന്ന് അടുത്തത് ‘are’ എന്നും പ്രവചിക്കുകയും ഒടുവിൽ ‘welcome’ എന്നും പ്രവചിക്കുകയും ചെയ്യുന്നു. ഇത് എങ്ങനെ പ്രവർത്തിക്കുന്നുവെന്ന് മനസ്സിലാക്കാൻ എന്തു ചെയ്യേണ്ടി വരുമെന്ന് നമുക്ക് ഒന്ന് നോക്കാം.
ട്രാൻസ്ഫോർമർ ഘടന
ഒരു ട്രാൻസ്ഫോർമർ മോഡലിൽ എൻകോഡർ, ഡീകോഡർ എന്നീ രണ്ട് പ്രധാന ഭാഗങ്ങളാണുള്ളത്. എൻകോഡർ ഇൻപുട്ട് വാക്യം പ്രോസസ്സ് ചെയ്യുകയും എൻകോഡ് ചെയ്യുകയും ചെയ്യുമ്പോൾ ഡീകോഡർ ഔട്ട്പുട്ട് വാക്യം പ്രോസസ്സ് ചെയ്യുകയും ഡീകോഡ് ചെയ്യുകയും ചെയ്യുന്നു. ഡീകോഡറിന് നൽകുന്ന ഔട്ട്പുട്ട് വാക്യം പ്രതീക്ഷിക്കുന്നതോ അടുത്തതോ ആയ വാക്ക് പ്രവചിക്കാൻ ഫലങ്ങൾ ഉപയോഗിക്കുന്നു.
പരിശീലന സമയത്ത്, ഇൻപുട്ട് വാക്യം നൽകുമ്പോൾ ഔട്ട്പുട്ട് വാക്യത്തിൽ എങ്ങനെ പ്രതികരിക്കണമെന്ന് ട്രാൻസ്ഫോർമർ മോഡലിനെ പഠിപ്പിക്കുന്നതിന് നമ്മൾ ഇൻപുട്ട് വാക്യവും ഔട്ട്പുട്ട് വാക്യവും നൽകുന്നു. ഒരു വാക്യത്തിലെ ഓരോ വാക്കും പ്രവചിക്കുന്നതിന് ട്രാൻസ്ഫോർമർ എൻകോഡറിലും ഡീകോഡറിലും നടത്തുന്ന പ്രവർത്തനഘട്ടങ്ങൾ ഇവയാണ്:
1. വേർഡ് എംബെഡ്ഡിങ്സ് — ട്രാൻസ്ഫോർമർ ഒരു വാക്യത്തിലെ ഓരോ പദത്തെയും പ്രതിനിധീകരിക്കുന്നതിനായി യഥാർത്ഥ സംഖ്യകളുടെ വെക്റ്ററാക്കി മാറ്റുന്നു.
2. പൊസിഷനൽ എൻകോഡിങ് — ഒരു വാക്യത്തിലെ പദക്രമം ട്രാക്ക് ചെയ്യാൻ ഇത് ഉപയോഗിക്കുന്നു. കാരണം നമുക്ക് കൃത്യമായ ഒരേ വാക്കുകളുള്ളതും എന്നാൽ വ്യത്യസ്ത അർത്ഥങ്ങളുള്ളതുമായ രണ്ട് വാക്യങ്ങൾ ഉണ്ടായിരിക്കാം. ഉദാ: ‘The bat at the cat’, ‘The cat at the bat’.
3. സെൽഫ് അറ്റെൻഷൻ — ട്രാൻസ്ഫോർമർ മോഡലിന് കൂടുതൽ സന്ദർഭം നൽകുന്നതിന്, ഒരു വാക്യത്തിലെ ഓരോ പദവും തമ്മിലുള്ള ബന്ധം ഓരോ വാക്കിനും ക്വറികൾ, കീകൾ, മൂല്യങ്ങൾ എന്നിവ സൃഷ്ടിച്ച് അവയെ ഗുണിച്ച് ചേർത്തുകൊണ്ട് കണക്കാക്കുന്നു, അവ സെൽഫ് അറ്റെൻഷൻ മൂല്യങ്ങളോ സ്കോറുകളോ ആണ്. ഇതാണ് അടിസ്ഥാനപരമായി സെൽഫ് അറ്റെൻഷൻ എന്നതിന്റെ അർത്ഥം.
4. റെസിഡ്യൂൽ കണക്ഷനുകൾ — ഓരോ വാക്കിന്റെയും മുമ്പത്തെ പൊസിഷനൽ എൻകോഡിങ് മൂല്യങ്ങൾ അന്തിമ സെൽഫ് അറ്റെൻഷൻ മൂല്യങ്ങളുമായി ആഡ് ചെയ്യുന്നു. അപ്പോൾ മറ്റൊരു സെറ്റ് ഔട്ട്പുട്ടുകൾ ലഭിക്കും. ആഡ് ചെയ്തതിനുശേഷം ഔട്ട്പുട്ടുകൾ പിന്നീട് നോർമലൈസ് ചെയ്യുന്നു.
5. ഫീഡ്-ഫോർവേഡ് ലെയർ — നോർമലൈസ് ചെയ്ത ഔട്ട്പുട്ടുകൾ ഒരു സ്റ്റാൻഡേർഡ് ഫീഡ്-ഫോർവേഡ് ന്യൂറൽ നെറ്റ്വർക്കിലൂടെ കടന്നുപോയി ഫീഡ്-ഫോർവേഡ് ഔട്ട്പുട്ടുകൾ സൃഷ്ടിക്കുന്നു.
6. റെസിഡ്യൂൽ കണക്ഷനുകൾ — ഈ ഫീഡ് ഫോർവേഡ് ഔട്ട്പുട്ടുകളിലേക്ക് പുതിയ റെസിഡ്യൂൽ കണക്ഷനുകൾ ചേർക്കുന്നു. എന്നാൽ ഇത്തവണ മുമ്പ് നോർമലൈസ് ചെയ്ത ഔട്ട്പുട്ടുകൾക്കും ഫീഡ് ഫോർവേഡ് ഔട്ട്പുട്ടുകൾക്കും ഇടയിലുള്ള കൂട്ടിച്ചേർക്കൽ കൂടി ഇതിൽ ഉൾപ്പെടുന്നു. ഇതിനു ശേഷം ഔട്ട്പുട്ടുകൾ മുമ്പത്തെപ്പോലെ വീണ്ടും നോർമലൈസ് ചെയ്യുന്നു.
മേൽ സൂചിപ്പിച്ച എല്ലാ പ്രവർത്തനങ്ങളും എൻകോഡറിനും ഡീകോഡറിനും ബാധകമാണ്. എന്നിരുന്നാലും, എൻകോഡറിനെ അപേക്ഷിച്ച് ഡീകോഡറിൽ കൂടുതൽ ലെയറുകളും കൂടുതൽ ഘട്ടങ്ങളും ഉൾപ്പെടുന്നു.
ഭാഷാ മാതൃകകളുടെ കഴിവുകൾ
ഇന്നത്തെ ഭാഷാ മാതൃകകൾക്ക് അത്ഭുതപ്പെടുത്തുന്ന കഴിവുകളാണുള്ളത്. അവയ്ക്ക് മനുഷ്യന്റെ ഭാഷയിൽ സ്വാഭാവികമായി സംസാരിക്കാൻ കഴിയും, ലേഖനങ്ങൾ എഴുതും, കവിതകൾ രചിക്കും, കോഡ് എഴുതും, ഗണിത പ്രശ്നങ്ങൾ പരിഹരിക്കും, വിവിധ ഭാഷകളിലേക്ക് പരിഭാഷ നടത്തും …. ഇതിനൊപ്പം ചിത്രങ്ങൾ കാണാനും വിവരിക്കാനും കഴിയുന്ന മൾട്ടിമോഡൽ മാതൃകകളും ഇപ്പോൾ ലഭ്യമാണ്. നമ്മൾ നൽകുന്ന നിർദ്ദേശങ്ങൾ അനുസരിച്ച് ചിത്രങ്ങൾ, വീഡിയോ, സംഗീതം എന്നിവയടക്കം വളരെ ശ്രമകരമായ ജോലികളും ഇവയ്ക്ക് സാധിക്കുന്നു.
എന്നാൽ ഇതിൽ ഏറ്റവും ശ്രദ്ധേയമായ കാര്യം ഇതേ സാങ്കേതികവിദ്യ ഉപയോഗിച്ചു തന്നെ ജനിതക മാതൃകകളും തന്മാത്രകളും പുതിയ മരുന്നുകളുമൊക്കെ നിർമിക്കാൻ കഴിയുന്ന ടൂളുകൾ വിവിധ ഗവേഷണശാലകൾ നിർമിച്ച് പ്രയോഗത്തിൽ വരുത്തിക്കൊണ്ടിരിക്കുന്നു എന്നതാണ്. 20 കോടി പ്രോട്ടീൻ തന്മാത്രകളുടെ മാതൃകകൾ കൃത്യമായി പ്രവചിച്ച ഡീപ്മൈൻഡ് ആൽഫാഫോൾഡ് എന്ന മോഡൽ, ജനിതക ഘടന നിർണയിക്കാൻ കഴിവുള്ള ആൽഫാജീനോം, തുടങ്ങിയവ ഇതിൽ ശ്രദ്ധേയമാണ്. കോഡിങ്, ശാസ്ത്രരംഗത്തെ കംപ്യൂട്ടിങ്- എന്നിവയിൽ വളരെ സഹായകരമായ വൈബ് കോഡിങ് ഈ സാങ്കേതികവിദ്യയുടെ വളരെ നിർണായകമായ വഴിത്തിരിവാണ്.
എന്നാൽ ജനറേറ്റീവ് എ ഐയുടെ ഏറ്റവും പ്രധാനപ്പെട്ട പരിമിതി എന്തെന്നാൽ, ഇവ അടുത്ത വാക്ക് പ്രവചിക്കാൻ മാത്രമേ പരിശീലിപ്പിക്കപ്പെട്ടിട്ടുള്ളൂ എന്നതാണ്. ഇതുകാരണം അവ ചിലപ്പോൾ തെറ്റായ വിവരങ്ങൾ സൃഷ്ടിക്കും എന്നത് ഒരു ന്യൂനതയാണ്. ഇവയ്ക്ക് ശരിക്കും സർഗാത്മകമായി ഒരു രചന നടത്താൻ കഴിയില്ല, പകരം നിലവിലുള്ള സൃഷ്ടികളിൽ നിന്നുള്ള അറിവു വച്ച് പ്രവചനം നടത്തുകയാണ് ചെയ്യുന്നത്. എ ഐ ഹാലൂസിനേഷൻ എന്നൊക്കെ അറിയപ്പെടുന്ന ന്യൂനതകൾ മനസ്സിലാക്കാൻ കഴിവില്ലാതെ നടത്തുന്ന ഉപയോഗങ്ങൾക്ക് നമ്മളെ കുഴപ്പത്തിലാക്കാൻ സാധിക്കും.
ഏജന്റിക് എ ഐയും മൾട്ടി-ഏജന്റ് സങ്കേതങ്ങളും
ഇന്ന് എഐ മേഖലയിൽ ഏറ്റവും ചർച്ചയാകുന്ന വിഷയം ‘ഏജന്റിക് എ ഐ (Agentic AI)’ എന്ന ആശയമാണ്. ഇത് എ ഐയെ വെറുമൊരു ചാറ്റ്ബോട്ടിൽ നിന്ന് ഒരു സ്വതന്ത്ര പ്രവർത്തനം നടത്താൻ കഴിയുന്ന ഏജന്റായി മാറ്റാനുള്ള ശ്രമമാണ്. ഈ ഏജന്റുകൾക്ക് ഇന്റർനെറ്റിൽ തിരയാം, ഫയലുകൾ വായിക്കാം, മറ്റ് സോഫ്റ്റ്വെയറുകൾ ഉപയോഗിക്കാം, തീരുമാനങ്ങൾ എടുക്കാം അങ്ങനെ ഒരാൾ ഒരു കാര്യം ചെയ്യാനായി ആശ്രയിക്കേണ്ട വിവിധ ഉപാധികളെ ഒന്നിച്ചു കൊണ്ടു വരുന്നു. അല്ലെങ്കിൽ പലർ ചേർന്ന് ചെയ്യുന്ന ജോലി ഒരാൾക്ക് ചെയ്യാൻ സാധിക്കുന്നു.
മൾട്ടി ഏജന്റ് സിസ്റ്റങ്ങളിൽ ഒന്നിലധികം എ ഐ ഏജന്റുകൾ ഒരുമിച്ച് പ്രവർത്തിക്കുന്നു. ഉദാഹരണത്തിന്, ഒരു ഗവേഷണ പ്രോജക്ടിനായി ഒരു ഏജന്റ് ഡാറ്റ ശേഖരിക്കുന്നു, മറ്റൊരു ഏജന്റ് അത് വിശകലനം ചെയ്യുന്നു, മൂന്നാമത്തേത് റിപ്പോർട്ട് തയ്യാറാക്കുന്നു. ഈ സമീപനം എ ഐയുടെ കഴിവുകൾ വിപുലപ്പെടുത്തുന്നു.
ഏജന്റിക് എ ഐ വികാസത്തിലെ ഒരു ചിത്രീകരണം എംസിപികളും പ്രോംപ്റ്റ് എഞ്ചിനീയറിങ്ങും
എ ഐ മോഡലുകളുടെ പെരുപ്പവും അവ നിർമിക്കുന്ന കമ്പനികൾ തമ്മിലുള്ള കിടമത്സരവും കാരണം ധാരാളം മോഡലുകൾ ഓരോ മാസവും പുറത്തിറങ്ങുന്നുണ്ട്. അടിസ്ഥാനപരമായി എല്ലാം ട്രാൻസ്ഫോർമർ മോഡലുകൾ ഉപയോഗിക്കുന്ന ഏതെങ്കിലും ഫൗണ്ടേഷണൽ മോഡൽ (ഉദാ: ജിപിടി 4) ആണെങ്കിലും അവയെ റീസണിങ് മോഡലുകൾ, ഡീപ്-സെർച്ച് മോഡലുകൾ എന്നിങ്ങനെയൊക്കെ വിളിച്ച് ഓരോ ഉപയോഗങ്ങൾക്കായി ഫൈൻ ട്യൂൺ ചെയ്ത് ഇറക്കുന്നതാണ്. ഇതു കൂടാതെ നമുക്ക് സ്വന്തമായി ട്രെയിൻ ചെയ്യാൻ പറ്റുന്ന രീതിയിൽ ഓപ്പൺ സോഴ്സ് മോഡലുകളും ഉണ്ട്. ഓപ്പൺ എഐ, ഗൂഗിൾ, ആന്ത്രോപിക് തുടങ്ങിയ കമ്പനികൾ അവരുടെ ഫൗണ്ടേഷണൽ മോഡലുകൾ പണം നൽകി ഉപയോഗിക്കാവുന്ന എപിഐകളും നൽകുന്നുണ്ട്. ഇവയെല്ലാം സൃഷ്ടിക്കുന്ന ആശയക്കുഴപ്പം പരിഹരിക്കാൻ ആന്ത്രോപിക് പുറത്തിറക്കിയ ഒരു പുതിയ സാങ്കേതികവിദ്യയാണ് മോഡൽ കോൺടെക്സ്റ്റ് പ്രോട്ടോക്കോൾ (MCP). ഇത് എഐ മാതൃകകളെ വിവിധ ടൂളുകളുമായും ഡാറ്റ സ്രോതസ്സുകളുമായും ബന്ധിപ്പിക്കാൻ സഹായിക്കുന്നു. ഇതുവഴി എഐയ്ക്ക് കൂടുതൽ കൃത്യമായ വിവരങ്ങൾ ലഭിക്കുന്നു.
ശരിയായ രീതിയിൽ ചോദിച്ചാൽ മാത്രമേ എഐയിൽ നിന്ന് മികച്ച ഉത്തരം ലഭിക്കൂ. ഇത്തരത്തിൽ എഐയോട് ചോദ്യംചോദിക്കുന്ന കലയാണ് പ്രോംപ്റ്റ് എഞ്ചിനീയറിങ് എന്നത്. ഇതിനുശേഷം വികസിച്ച കോൺടെക്സ്റ്റ് എഞ്ചിനീയറിങ്ങിൽ (Context Engineering) എഐയ്ക്ക് അധിക വിവരങ്ങൾ നൽകി മികച്ച ഉത്തരങ്ങൾ ലഭിക്കാൻ ശ്രമിക്കുന്നു.
എൽഎൽഎമ്മിന് അതിന്റെ പണി എളുപ്പത്തിൽ നിർവഹിക്കാൻ കഴിയുന്ന തരത്തിൽ ശരിയായ വിവരങ്ങളും ടൂളുകളും ശരിയായ ഫോർമാറ്റിൽ നൽകുന്നതിന് കഴിയുന്ന ഡൈനാമിക് സിസ്റ്റങ്ങൾ നിർമിക്കുന്നതാണ് കോൺടെക്സ്റ്റ് എഞ്ചിനീയറിംഗ്. ഏജന്റ് സിസ്റ്റങ്ങൾ ശരിയായി പ്രവർത്തിക്കാത്തതിന്റെ ഒരു പൊതു കാരണം അവയ്ക്ക് ശരിയായ കോൺടെക്സ്റ്റ് ഇല്ല എന്നതാണ്. എൽഎൽഎമ്മുകൾക്ക് മനസ്സ് വായിക്കാൻ കഴിയില്ല. നമ്മൾ അവർക്ക് ശരിയായ വിവരങ്ങൾ നൽകേണ്ടതുണ്ട്. അല്ലെങ്കിൽ ഗാർബേജ് ഇൻ, ഗാർബേജ് ഔട്ട് എന്ന അവസ്ഥ ആയിരിക്കും.
സങ്കീർണമായ ഏജന്റുകൾക്ക് പല ഉറവിടങ്ങളിൽ നിന്നും കോൺടെക്സ്റ്റ് ലഭിക്കാൻ സാധ്യതയുണ്ട്. ആപ്ലിക്കേഷൻ ഡെവലപ്പർ, ഉപയോക്താവ്, മുൻ ഇടപെടലുകൾ, ടൂൾ കോളുകൾ അല്ലെങ്കിൽ മറ്റ് ബാഹ്യ ഡാറ്റ എന്നിവയിൽ നിന്ന് കോൺടെക്സ്റ്റ് വരാം. ഇവയെല്ലാം ഒരുമിച്ച് ചേർക്കുന്നതിൽ സങ്കീർണമായ ഒരു സിസ്റ്റം ഉൾപ്പെടുന്നു. ഇത്തരം സന്ദർഭത്തിലെ (context) പല ഭാഗങ്ങളും ഡൈനാമിക് ആയിരിക്കും. അതിനാൽ, അന്തിമ പ്രോംപ്റ്റ് നിർമിക്കുന്നതിനുള്ള യുക്തിയും ഡൈനാമിക് ആയിരിക്കണം. വെറുമൊരു സ്റ്റാറ്റിക് പ്രോംപ്റ്റ് വഴി ഇത് സാധിക്കില്ല.
കോൺടെക്സ്റ്റ് സ്റ്റോർ ചെയ്യുന്നതിനുള്ള ഒരു ലളിതമായ മാർഗമാണ് ഫയലുകൾ. പല പോപ്പുലർ ഏജന്റുകളും ഇത് ഉപയോഗിക്കുന്നു: ക്ലോഡ് കോഡ് CLAUDE.md എന്ന സങ്കേതം ഉപയോഗിക്കുന്നു. കഴ്സറും വിൻഡ്സർഫും റൂൾസ് ഫയലുകൾ ഉപയോഗിക്കുന്നു, കൂടാതെ ചില പ്ലഗിനുകൾ (ഉദാ. കഴ്സർ മെമ്മറി ബാങ്ക്) / MCP സെർവറുകൾ മെമ്മറി ഫയലുകളുടെ ശേഖരങ്ങൾ കൈകാര്യം ചെയ്യുന്നു.
ഗവേഷണ രംഗത്തെ വിപ്ലവം
ആൽഫാബെറ്റിന്റെ എ ഐ ഗവേഷണ സ്ഥാപനമായ ഡീപ്മൈൻഡ് നിർമിച്ച പ്രോട്ടീൻ ഘടനകൾ പ്രവചിക്കാനും തന്മാത്രാ പ്രവർത്തനങ്ങൾ മോഡൽ ചെയ്യാനും കഴിയുന്ന നൊബേൽ സമ്മാനം ലഭിച്ച എ ഐ മോഡൽ ആണ് ആൽഫാഫോൾഡ് (AlphaFold). അവരുടെ തന്നെ അൽഫാജിനോം (AlphaGenome) ഡിഎൻഎയുടെ രഹസ്യങ്ങൾ തുറന്നുകാട്ടാൻ സഹായിക്കുന്നു. ഈ സാങ്കേതികവിദ്യകൾ കാൻസർ ചികിത്സ മുതൽ വയോധിക ചികിത്സവരെ മാറ്റിമറിക്കാൻ പോകുകയാണ്. ഡീപ്മൈൻഡിന്റെ സിഇഒയും 2024-ലെ രസതന്ത്ര നോബൽ ജേതാവും ആയ ഡെന്നിസ് ഹസാബിസ് പറയുന്നത് അടുത്ത ഒരു ദശകത്തിനുള്ളിൽ നമ്മൾ എല്ലാ രോഗങ്ങളെയും കീഴടക്കുമെന്നാണ്!
ആൽഫാബെറ്റിന്റെ എഐ ഗവേഷണ ലബോറട്ടറി ആയ ഐസോമോർഫിക് ലാബ്സ്, പൂർണമായും നിർമിതബുദ്ധി ഉപയോഗിച്ച് രൂപകൽപ്പന ചെയ്ത മരുന്നുകളുടെ ആദ്യത്തെ മനുഷ്യ ക്ലിനിക്കൽ പരീക്ഷണങ്ങൾ ആരംഭിക്കാൻ തയ്യാറെടുക്കുകയാണ്. ഇത് ഔഷധ വികസനത്തിലെ ഒരു വഴിത്തിരിവാണ്. ഐസോമോർഫിക് ലാബ്സിന്റെ ലണ്ടൻ ഓഫീസിൽ കാൻസർ മരുന്ന് രൂപകൽപ്പനകളിൽ പ്രവർത്തിക്കുന്ന ടീമുകൾ എഐ ഉപയോഗിച്ചു രൂപകല്പന ചെയ്ത മരുന്നുകളാണ് ഹ്യുമൻ ട്രയലിന് തയ്യാറെടുക്കുന്നത്. ആൽഫഫോൾഡ് ഉപയോഗിച്ച് നിർമിച്ച മരുന്നുകളാണ് ഈ പരീക്ഷണങ്ങളിൽ ഉപയോഗിക്കുന്നത്. ഈ ഉദ്യമം മരുന്നുപരീക്ഷണങ്ങളിലെ പരമ്പരാഗതമായ 10% വിജയ നിരക്ക് മെച്ചപ്പെടുത്താൻ സാധ്യതയുണ്ടോ എന്നതാണ് ശാസ്ത്രലോകം ഉറ്റുനോക്കുന്നത്.
2021-ൽ ഡീപ്മൈൻഡിൽ നിന്ന് വേർപെട്ടു രൂപീകരിച്ച ഐസോമോർഫിക് ലാബ്സ്, ഫാർമസ്യൂട്ടിക്കൽ ഭീമന്മാരായ നൊവാർട്ടിസ്, എലി ലില്ലി എന്നിവരുമായി പങ്കാളിത്തം സ്ഥാപിക്കുകയും 2025 ഏപ്രിലിൽ 600 മില്യൺ ഡോളർ ധനസഹായം സമാഹരിക്കുകയും ചെയ്തു. ഗവേഷകർക്ക് ഒരു രോഗത്തെ തിരിച്ചറിയാനും കമ്പ്യൂട്ടേഷണൽ ചികിത്സാ രൂപകൽപ്പനകൾ സൃഷ്ടിക്കാനും കഴിയുന്ന ഒരു ഭാവിയാണ് കമ്പനി വിഭാവനം ചെയ്യുന്നത്. കമ്പനി പ്രസിഡന്റ് ആയ കോളിൻ മർഡോക്ക് പറയുന്നപോലെ ഭാവിയിൽ ഒരു പുതിയ രോഗം കണ്ടെത്തിയാൽ ഉടനെ ഒരു ബട്ടൺ ക്ലിക്കുചെയ്ത് ആ രോഗം പരിഹരിക്കുന്നതിനുള്ള ഒരു മരുന്നിന്റെ രൂപകൽപ്പന എഐ മോഡൽ തയ്യാറാക്കും!
മരുന്നു കണ്ടെത്തലിനെ സഹായിക്കുന്നതിൽ വിപ്ലവകരമായ മാറ്റങ്ങൾ വരുത്തുന്നതിലേക്ക് എ ഐ നീങ്ങുന്ന ചരിത്രനിമിഷമാണിത്. വിജയകരമായ പരീക്ഷണങ്ങൾ വഴി എ ഐക്ക് ഡിസൈൻ ചെലവുകളും സമയപരിധിയും ഗണ്യമായി കുറയ്ക്കാൻ കഴിയുമെന്ന് തെളിയിച്ചാൽ, ലോകമെമ്പാടുമുള്ള ദശലക്ഷക്കണക്കിന് രോഗികൾക്ക് ഇത് ഗുണഫലങ്ങൾ സൃഷ്ടിക്കും.
സാങ്കേതിക വെല്ലുവിളികൾ
ഇതൊക്കെയാണെങ്കിലും ഇത്തരം ഭാഷാ മോഡലുകൾ പ്രവർത്തിപ്പിക്കാൻ വലിയ അളവിൽ ഊർജ്ജം ആവശ്യമാണ്. ഇവയെ പരിശീലിപ്പിക്കാൻ ദശലക്ഷക്കണക്കിന് ഡോളർ ചെലവാകും. ഇതിന് ഉപയോഗിക്കുന്ന കമ്പ്യൂട്ടറുകളും ഡാറ്റ സൂക്ഷിക്കുന്ന സർവറുകളും മറ്റും ഹരിതഗൃഹ വാതകങ്ങൾ വലിയ അളവിൽ പുറത്തുവിടേണ്ടി വരുന്നു. ഈ പരിസ്ഥിതി പ്രശ്നം പരിഹരിക്കാൻ കൂടുതൽ കാര്യക്ഷമമായ മാതൃകകൾ വികസിപ്പിക്കേണ്ടതുണ്ട്.
ഭാഷാപഠനത്തിൽ മാറ്റങ്ങൾ
എ ഐയുടെ വികാസം ഭാഷാപഠന മേഖലയിലും വലിയ മാറ്റങ്ങൾ കൊണ്ടുവരുന്നു. ഇപ്പോൾ തത്സമയ പരിഭാഷാ സേവനങ്ങൾ ലഭ്യമാണ്. എന്നാൽ മലയാളം പോലുള്ള പ്രാദേശിക ഭാഷകൾക്ക് ഇപ്പോഴും കൂടുതൽ ഡാറ്റയും സാങ്കേതിക സഹായവും ആവശ്യമാണ്. ഭാഷാ വൈവിധ്യം സംരക്ഷിക്കാൻ ഇത് ഒരു വെല്ലുവിളിയും അതോടൊപ്പം അവസരവുമാണ്. പ്രാദേശിക ഭാഷകളിൽ ആവശ്യത്തിന് ഡാറ്റ നൽകി പരിശീലിപ്പിച്ചാൽ മാത്രമേ മികച്ച എ ഐ വിന്യാസം ഇക്കാര്യത്തിൽ സാധ്യമാകൂ. എങ്കിലും ഭാഷയുടെ അതിർവരമ്പുകൾ ഇല്ലാതാക്കി തത്സമയ പരിഭാഷ പോലുള്ള കാര്യങ്ങൾ എളുപ്പത്തിലാക്കാൻ നിർമിതബുദ്ധി സങ്കേതങ്ങൾക്ക് കഴിയുന്നുണ്ട്.
ടെക് ആധിപത്യ യുദ്ധം
ഇന്ന് ഗൂഗിൾ, ഓപ്പൺ എഐ, മൈക്രോസോഫ്റ്റ്, മെറ്റ, ആന്ത്രോപിക്, എക്സ് എഐ തുടങ്ങിയ കമ്പനികൾ ഈ മേഖലയിൽ ആധിപത്യം നേടാൻ കടുത്ത മത്സരത്തിലാണ്. ചൈനയും ഇന്ത്യയും പോലുള്ള രാജ്യങ്ങളും യൂറോപ്യൻ യൂണിയനും ഈ മേഖലയിൽ നിക്ഷേപം വർദ്ധിപ്പിക്കുന്നു. ഇത് സാങ്കേതിക വികസനത്തെ വേഗത്തിലാക്കുന്നു എങ്കിലും വിഭവശേഷി ചൂഷണവും പാരിസ്ഥിതിക പ്രശ്നങ്ങളും വർദ്ധിപ്പിക്കാൻ ജനറേറ്റീവ് എ ഐയുടെ പ്രചാരം ഇടയാക്കിയിട്ടുണ്ട്. അതോടൊപ്പം ഈ മേഖലയിലെ വർദ്ധിച്ച കിടമത്സരം മനുഷ്യന്റെ തൊഴിൽ ഇല്ലാതാക്കി യന്ത്രങ്ങൾ വാഴുന്ന കാലത്തിലേക്ക് നയിക്കുമോ എന്ന ആശങ്കയും ഇല്ലാതില്ല.
ഭാവിയിലേക്കുള്ള നോട്ടം
ആർട്ടിഫിഷ്യൽ ജനറൽ ഇന്റലിജൻസ് (AGI) അഥവാ മനുഷ്യന്റെ ബുദ്ധിക്ക് തുല്യമായ എ ഐ എന്ന ലക്ഷ്യത്തിലേക്ക് വേഗത്തിൽ നീങ്ങാൻ ഇതോടെ കഴിയുമെന്ന് ഒരു വിഭാഗം ശാസ്ത്രജ്ഞർ കരുതുന്നു. ഭാവിയിൽ ഈ സാങ്കേതികവിദ്യ വിദ്യാഭ്യാസം, ആരോഗ്യം, ഗതാഗതം, കൃഷി, വിനോദം തുടങ്ങി എല്ലാ മേഖലകളിലും വിപ്ലവം കൊണ്ടുവരും എന്നും വിലയിരുത്തപ്പെടുന്നു. എങ്കിലും ഡ്രോണുകൾ അടക്കമുള്ള എ ഐ അധിഷ്ഠിത റോബോട്ടിക്സിലും മറ്റും ഉണ്ടാക്കുന്ന മാറ്റങ്ങൾ സൂചിപ്പിക്കുന്നത് 2030 -ഓടെ ആയുധ നിർമാണം, യുദ്ധങ്ങൾ എന്നിവയിൽ ഇത്തരം സാങ്കേതികവിദ്യകളുടെ ആധിപത്യം ഉണ്ടായേക്കുമെന്നാണ്.
അതിനാൽ സാങ്കേതികവിദ്യ വികസിക്കുന്നതിനൊപ്പം ഉത്തരവാദിത്തത്തോടെയുള്ള എഐ വികസനം, സുരക്ഷ, സ്വകാര്യത, തൊഴിലവസരങ്ങളിലുണ്ടാകുന്ന മാറ്റങ്ങൾ സംബന്ധിച്ച പഠനങ്ങൾ എന്നിവയും പ്രധാനമാണ്. എ ഐയുടെ ഗുണങ്ങൾ എല്ലാവർക്കും ലഭ്യമാകുന്ന തരത്തിൽ വികസിപ്പിക്കേണ്ടത് നമ്മുടെ ഉത്തരവാദിത്തമാണ്. സർക്കാരുകളും സംഘടനകളും ഓരോ വ്യക്തിയും ഇക്കാര്യത്തിൽ ക്രിയാത്മകമായ ഇടപെടലുകൾ നടത്തേണ്ടത് അനിവാര്യമാണ്.
ഉപസംഹാരം
ലാർജ് ലാംഗ്വേജ് മോഡലുകൾ നമ്മുടെ ജീവിതത്തെ മാറ്റിമറിക്കുന്ന ശക്തമായ സങ്കേതങ്ങളാണ്. ഇവയുടെ സാധ്യതകൾ അതിവിശാലമാണ്. എന്നാൽ ഇതിന്റെ ഗുണദോഷങ്ങൾ മനസ്സിലാക്കി, മനുഷ്യകുലത്തിന്റെ നന്മയ്ക്കായി ഉപയോഗിക്കേണ്ടത് നമ്മുടെ ഉത്തരവാദിത്തമാണ്. ആഗോളവൽക്കരണത്തിന്റെ ഈ കാലഘട്ടത്തിൽ, നമ്മുടെ ഭാഷയും സംസ്കാരവും സംരക്ഷിച്ചുകൊണ്ടുതന്നെ ഈ സാങ്കേതിക വിപ്ലവത്തിന്റെ ഭാഗമാകാൻ നമുക്ക് കഴിയും. l



