Tuesday, June 30, 2026

ad

Homeകവര്‍സ്റ്റോറിനിർമിതബുദ്ധിയിൽ ചുട്ടെടുത്ത ധവളപത്രം

നിർമിതബുദ്ധിയിൽ ചുട്ടെടുത്ത ധവളപത്രം

പ്രതീഷ് പ്രകാശ്‌

യുഡിഎഫ് സർക്കാർ പുറത്തിറക്കിയ ധവളപത്രം തയ്യാറാക്കാൻ വേണ്ടി LLM (Large Language Model അഥവാ ബൃഹദ് ഭാഷാമാതൃകകൾ) ഉപയോഗിച്ചത് ഏറെ ചർച്ചകൾക്ക് തിരികൊളുത്തിയിരിക്കുകയാണല്ലോ. മുഖ്യമന്ത്രി വിഡി സതീശന്‍ ഈ ആരോപണം നിഷേധിച്ചുവെങ്കിലും പ്രസ്തുത രേഖ തയ്യാറാക്കിയ കെ. എം. ചന്ദ്രശേഖർ ‘മാതൃഭൂമി’ക്ക് നൽകിയ അഭിമുഖത്തിൽ ധവളപത്രത്തിലെ “AI പ്രയോഗത്തെക്കുറിച്ച്” കുറ്റസമ്മതം നടത്തുന്നുണ്ട്. അദ്ദേഹത്തിന്റെ സംഘം അത് കേവലം “document formatting’ന് വേണ്ടിയാണത്രേ LLM ഉപയോഗിച്ചത്. ഇത്രയും സങ്കീർണവും ദൈർഘ്യവുമുള്ള ഒരു രേഖയിൽ “ഫോർമാറ്റിങ്ങിന് വേണ്ടിമാത്രം AI ഉപയോഗിച്ചു’ എന്ന അവകാശവാദം ഒട്ടുംതന്നെ വിശ്വസനീയമല്ല. പ്രത്യേകിച്ചും, രണ്ട് വ്യത്യസ്ത ഡിറ്റക്ഷൻ സിസ്റ്റങ്ങള്‍, ധവളപത്രത്തിലെ ബഹുഭൂരിപക്ഷം ഭാഗവും AI- generated content ആണ്‌ എന്ന് കണ്ടെത്തിയ സ്ഥിതിക്ക്.

ധവളപത്രം പോലെയൊരു പ്രധാനപ്പെട്ട രേഖ ബൃഹദ് ഭാഷാമാതൃകകള്‍ ഉപയോഗിച്ചുകൊണ്ട് തയ്യാറാക്കുന്നതിലെ ശരികേടുകളെക്കുറിച്ചു പറയുന്നതിനുമുമ്പേ, ഈ വിധ സങ്കേതങ്ങളെ “ബുദ്ധിയുമായി’ സംയോജിപ്പിച്ചുകൊണ്ടുള്ള സംജ്ഞകൾ ഉപയോഗിച്ചുകൊണ്ട്‌ – നിര്‍മിത ബുദ്ധി (Artificial Intelligence) എന്നു വിശേഷിപ്പിക്കുന്നതിലെ ധാരണാപ്പിശകെന്തെന്ന് വിശദീകരിക്കേണ്ടതുണ്ട്.

ബുദ്ധി എന്നാലെന്താണ്?
കേവലമായ ഓർമശക്തിയെയല്ല നാം ബുദ്ധി എന്നു വിളിക്കുന്നത്. ഉദാഹരണത്തിന്, സങ്കലനം എന്ന ഗണിതപ്രക്രിയയെ നാം ആശയതലത്തിൽ സ്വാംശീകരിച്ചിരിക്കുന്നത് സങ്കലനപ്പട്ടിക കാണാതെ പഠിച്ച ഒരോർമയായി മാത്രമല്ല. മറിച്ച്, നാം ജീവിക്കുന്ന ഭൗതികപ്രപഞ്ചത്തെ മനസ്സിലാക്കാനും കാര്യകാരണ ബന്ധം വിശദീകരിക്കാനും സഹായിക്കുന്ന ഒരു യുക്തിബോധം നാം അതിൽകൂടി സ്വായത്തമാക്കുന്നു.

പ്രത്യേകമായ ഉദ്ദേശ്യത്തോടെയല്ലാതെ നടത്തുന്ന പ്രവർത്തനങ്ങളെയും നാം ബുദ്ധിയുടെ പ്രയോഗമായി കണക്കാക്കാറില്ല. ഉദാഹരണത്തിന്, തേനീച്ചകൾ കൂടുകൂട്ടുന്നത് ബോധപൂർവമായ ഒരു രൂപകല്പനയുടെ അടിസ്ഥാനത്തിലല്ല. തങ്ങളുടെ ശരീരത്തിലെ ഗ്രന്ഥികളിൽ നിന്നും ഉല്പാദിപ്പിക്കപ്പെടുന്ന മെഴുക് ശരീരത്തിന്റെ ചുറ്റും, നിലവിലെ കൂടിനോട് ചേര്‍ന്ന് വൃത്താകൃതിയിൽ തേച്ചുപിടിപ്പിക്കുകയാണ്. ഇതൊരു ജൈവികമായ പ്രതികരണം മാത്രമാണ്. അതിന്റെ ഭാഗമായി ഉണ്ടാകുന്നതാണ് അറകൾ.

ബോധപൂർവം നടത്തുന്ന പ്രവർത്തനങ്ങൾക്ക് – (ഉദാഹരണത്തിന്‌, കല്ലുകൾ മൂര്‍ച്ച കൂട്ടി വേട്ടയാടാനുള്ള ആയുധമാക്കുക) – ചോദന നൽകുന്ന, ബോധപൂർവമായ തീരുമാനങ്ങളെടുക്കാൻ സഹായിക്കുന്ന, പഠനത്തിലൂടെയും അനുഭവങ്ങളിലൂടെയും പരിശീലനത്തിലൂടെയും (ഇവയെല്ലാംതന്നെ ബോധപൂർവം ചെയ്യുന്ന പ്രവർത്തനങ്ങളുമാണ്) ആർജിച്ചെടുക്കുന്ന ശേഷിയാണ് ബുദ്ധി. ഈ ബുദ്ധിയും കായികശക്തിയും സംയോജിപ്പിച്ചുകൊണ്ടുള്ള അദ്ധ്വാനപ്രയോഗത്തിലൂടെയാണ് മനുഷ്യർ തങ്ങളുടെ ഉപജീവനത്തിനാവശ്യമായ നിലയിൽ പ്രകൃതിയെ മാറ്റിയെടുക്കുന്നത്.

ഇങ്ങനെ ബോധപൂർവവും സൃഷ്ടിപരവുമായ ഇടപെടലുകൾക്ക് മനുഷ്യനെ പ്രാപ്തനാക്കുന്ന തലച്ചോറിന്റെ ആ പ്രത്യേകശേഷിയെയാണ്‌ നാം ബുദ്ധി (Intelligence) എന്നു വിളിക്കുന്നത്.

എന്തുകൊണ്ട്‌ “നിര്‍മിത ബുദ്ധി’ ബുദ്ധിയല്ല?
നിര്‍മിതബുദ്ധി എന്ന പേരില്‍ പൊതുവിലറിയപ്പെടുന്ന സാങ്കേതികവിദ്യകൾ–മെഷീന്‍ ലേണിങ്‌, ഡീപ്പ് ലേണിങ് മുതലായവ–വലിയ സാങ്കേതിക മുന്നേറ്റമാണ് ഉണ്ടാക്കിയത് എന്ന കാര്യത്തില്‍ സംശയമൊന്നുമില്ല. അവയൊക്കെ പണ്ടുമുതലേ തന്നെ ശാസ്ത്ര–സാങ്കേതിക ഗവേഷണ മേഖലകളിൽ ദശാബ്ദങ്ങളായി ഉപയോഗിച്ചുവരുന്ന സങ്കേതങ്ങളുമാണ്.

ഉദാഹരണത്തിന്, മെഷീൻ ലേണിങ് പഠിച്ചു തുടങ്ങുന്ന വിദ്യാർത്ഥികൾ പഠിക്കുന്ന രേഖീയ പ്രതിലോമകം (Linear Regression) 1800കളുടെ തുടക്കത്തിലാണ് അവതരിപ്പിക്കപ്പെടുന്നത്. “മെഷീൻ ലേണിങ്’ എന്ന പേര് തന്നെ ആദ്യമായി ഉപയോഗിക്കുന്നത് 1952ൽ, ഐബിഎമ്മിലെ ഗവേഷകനായിരുന്ന ആർതർ സാമുവൽ ആയിരുന്നു. “ചെക്കേഴ്സ്’ എന്നു പേരായ പലകക്കളി (boardgame) കളിക്കാനായി കമ്പ്യൂട്ടറിനെ സ്വയം “പഠിപ്പിക്കാൻ’ വികസിപ്പിച്ചെടുത്ത അൽഗോരിതമായിരുന്നു ഇത്. സമാനമായി, ഇന്നത്തെ ബൃഹദ് ഭാഷാമാതൃകകളുടെ പ്രാഗ്‌രൂപമായ പെർസെപ്ട്രോണ്‍ (Perceptron) എന്നു പേരായ ന്യൂറൽ നെറ്റ്‌വർക്ക് നിർമിക്കപ്പെട്ടത് 1957ൽ കോർണൽ എയ്-റോനോട്ടിക്കൽ ലാബിലെ ഗവേഷകനായിരുന്ന ഫ്രാൻക് റോസെൻബ്ലാറ്റ് ആണ്.

ശാസ്ത്ര-ഗവേഷണ രംഗങ്ങളിലൊതുങ്ങിനിന്നിരുന്ന ഈ സാങ്കേതികവിദ്യകൾക്ക് പൊടുന്നനെ ഒരു പുതുവളർച്ചയുണ്ടായത് ഇന്റർനെറ്റിന്റെ വരവോടെയും അസാമാന്യശേഷിയുള്ള കമ്പ്യൂട്ടർ പ്രോസസ്സറുകളുടെ വരവോടെയും മാത്രമല്ല; മറിച്ച് ബൃഹത്തായ വിവരശേഖരങ്ങൾ (Big Data) ഉപയോഗിച്ച് മൂലധനം ഇരട്ടിപ്പിക്കാനുതകുന്ന ഉല്പന്നങ്ങൾ എളുപ്പത്തിൽ നിർമിക്കാമെന്ന മുതലാളിത്തതാല്പര്യങ്ങൾ കൂടിയാണ് ഇതിനു പിന്നിലുള്ളത്. യഥാർത്ഥത്തിൽ, ലോകമെമ്പാടുമുള്ള കോടിക്കണക്കിന് മനുഷ്യരുടെ ബൗദ്ധികാധ്വാനം (Intellectual Labor) ചൂഷണം ചെയ്തുകൊണ്ടാണ് ഈ മാതൃകകളെ പരിശീലിപ്പിക്കുന്നത്. സമീപകാലത്തെ ഇതിന്റെ ഏറ്റവും ശ്രദ്ധേയമായ ഉല്പന്നമാണ് ബൃഹദ്‌ ഭാഷാ മാതൃകകൾ. ഇവയ്ക്ക് “സ്വന്തമായി ബുദ്ധിയുണ്ട്’ എന്ന് വരുത്തിത്തീർക്കുന്നതിലൂടെ, അതിനു പിന്നിലുള്ള മനുഷ്യന്റെ അധ്വാനവും ചൂഷണവും അതിവിദഗ്ദ്ധമായി മറച്ചുവയ്ക്കപ്പെടുകയാണ്.

എന്താണ് ബൃഹദ്‌ ഭാഷാമാതൃകകൾ?
ഏറ്റവും ലളിതമായി പറഞ്ഞാൽ, രണ്ട് വാക്കുകൾ തന്നാൽ മൂന്നാമത്തെ വാക്കെന്താണെന്നു കണ്ടുപിടിക്കുക. – ഇതാണ് ബൃഹദ്‌ ഭാഷാമാതൃകകൾ ചെയ്യുന്നത്. Next token prediction എന്നാണ് ഇതിനു പറയുന്ന പേര്. അതായത്, മൂന്നാമത് വരാൻ എറ്റവുമധികം സാധ്യതയുള്ള വാക്കേതാണ് എന്നു കണ്ടുപിടിക്കുക. ഇങ്ങനെ വരുന്ന മൂന്നുവാക്കുകൾ അടുക്കിവെച്ചാൽ നാലാമത്തെ വാക്കേതാണ്, നാലെണ്ണം അടുക്കിവയ്ക്കുമ്പോൾ അഞ്ചാമത്തെ വാക്കേതാണ് എന്നൊക്കെ കണ്ടുപിടിക്കുന്നു.

സഹസ്രകോടിക്കണക്കിന് വാക്യങ്ങളുടെ ഘടന “പഠിച്ചു’കൊണ്ടാണ് ഇത് സാധ്യമാക്കുന്നത്. അതായത്, ഇത്രയധികം വാക്യങ്ങൾ കാണുമ്പോഴും അടുത്ത് വരാൻ സാധ്യതയുള്ള വാക്കുകൾ ഏതൊക്കെയാണ‍്, അതിന്റെ സംഭവ്യത എത്രയാണ് എന്നു ഗണിച്ചു പറയാൻ മാത്രമാണ് ഇവയ്ക്ക് സാധിക്കുന്നത്, മറിച്ച് ഈ മൂന്ന് വാക്കുകൾ ചേർത്തു വയ്ക്കുമ്പോൾ മനുഷ്യർ മനസ്സിലാക്കുന്ന സാരം ദർശിക്കാൻ അവയ്ക്കുശേഷിയില്ല.

അതായത്, നിങ്ങളൊരു ചോദ്യംചോദിക്കുമ്പോൾ, മനുഷ്യ ഭാഷയ്ക്ക് സദൃശ്യമായ രീതിയിൽ, ഇനി വരാൻ സാധ്യത കൂടിയ വാക്കുകളടുക്കിപ്പെറുക്കി വയ്ക്കുകയാണ് ബൃഹദ്‌ ഭാഷാമാതൃകകൾ ചെയ്യുന്നത്. അതിനപ്പുറം, ഒരു ചോദ്യത്തിനുത്തരം നൽകുകയാണെന്നുള്ള ബോധം അതിനില്ല. ഇത് കൃത്യമായ ഉത്തരമാണോ എന്നുപോലും അതിനുറപ്പിച്ച് പറയാൻ കഴിയില്ല.

ഈ നിലയിൽ, ബൃഹദ് ഭാഷാമാതൃകകൾ ചെയ്യുന്ന ഒന്നും തന്നെ ബോധപൂർവം നടത്തുന്ന പ്രവർത്തനങ്ങളല്ല. അതുകൊണ്ടുതന്നെ, പ്രത്യേകിച്ചൊരു ഉദ്ദേശ്യത്തോടെ നടത്തപ്പെടുന്ന പ്രവർത്തനമായി അതിനെ കാണാനും കഴിയില്ല.

എന്നാൽ, പരസ്പരബന്ധമുള്ളതും (coherent) അർത്ഥവത്തായതും (meanin gful) ആയ ലിപിയുള്ള ഭാഷകൾ അതിന് ഉല്പാദിപ്പിക്കാൻ കഴിയുന്നു എന്നതാണ് അവയുടെ ഏറ്റവും വലിയ സവിശേഷതയായി നമുക്കു പറയാൻ കഴിയുന്നത്. മനുഷ്യഭാഷയെ അനുകരിക്കുന്ന നിലയിൽ സംഭാഷണങ്ങൾ സാങ്കേതികവിദ്യയിലൂടെ നിർമിക്കാൻ മനുഷ്യർക്ക് സാധിച്ചു എന്നത് ചെറിയ കാര്യമല്ല.

ബൃഹദ്‌ ഭാഷാമാതൃകകളുടെ 
പരിമിതികൾ
അതീവ ബുദ്ധിശാലികളായ മനുഷ്യരെക്കുറിച്ച് പൊതുവിൽ പറയുന്ന കാര്യമുണ്ട്. അവർക്ക് അപരിചിതമായ മേഖലകളെക്കുറിച്ച് എന്തെങ്കിലും ചോദിച്ചാൽ അവർ “അറിയില്ല’ എന്നുപറയും. തങ്ങൾക്ക് എന്തൊക്കെ അറിയാം, എന്തൊക്കെ അറിയില്ല എന്ന ബോധ്യവും ബുദ്ധിശക്തിയുടെ അടിസ്ഥാനമാണ്.

എന്നാൽ, ബൃഹദ് ഭാഷാമാതൃകകൾ ഇക്കാര്യത്തിൽ ‘തികഞ്ഞ’ അജ്ഞരാണ് (Lack of metacognition). തങ്ങൾക്ക് ഒരു കാര്യത്തെക്കുറിച്ച് അറിയില്ല എന്ന് അവർ സമ്മതിക്കില്ല. “Coherent” ആയ എന്തെങ്കിലും ഒരു മറുപടി നൽകും. ആ വിഷയത്തെക്കുറിച്ച് അറിയാവുന്നവർക്ക് ഇത് തെറ്റാണെന്ന് മനസ്സിലാകും. എന്നാൽ, അതിനെക്കുറിച്ച് ഒരു ധാരണയും ഇല്ലാത്തവരാണ് ഇത് കേൾക്കുന്നതെങ്കിലോ? അവരവരുടെ മുൻവിധികൾക്കനുസരിച്ച് (confirmation bias) ആ കാര്യങ്ങളെ വസ്തുതയെന്ന നിലയിൽ സ്വീകരിക്കാനാണ് സാധ്യത.

തങ്ങളുടെ training dataയ്ക്ക് പുറമേ നിന്നുള്ള പുതിയതായൊരു വിഷയം വന്നാൽ ബൃഹദ് ഭാഷാമാതൃകകൾക്ക് അവയെ ഒരു മനുഷ്യനെപ്പോലെ കൈകാര്യം ചെയ്യാൻ കഴിയില്ല. നേരത്തെ പറഞ്ഞതുപോലെ, തൊട്ടടുത്ത വാക്കുകൾ ഏതൊക്കെ വരാനാണ് സാധ്യത കൂടുതൽ എന്ന് കണ്ടുപിടിക്കുകയും അവ നിരത്തി വയ്ക്കുകയും ചെയ്യും. അതായത്, തങ്ങളുടെ ജ്ഞാനപരിസരത്തിനു പുറത്ത് നിന്നുകൊണ്ട് ചിന്തിക്കാനോ അല്ലെങ്കിൽ തങ്ങളുടെ പരിമിതികൾ മനസ്സിലാക്കിക്കൊണ്ട് പ്രവർത്തിക്കാനോ ഉള്ള ശേഷി ബൃഹദ് ഭാഷാ മാതൃകകൾക്കില്ല. ഇങ്ങനെ തോന്നിയപാട്, അറിവില്ലാത്ത കാര്യത്തെക്കുറിച്ച്, വാക്കുകൾ നിരത്തിവയ്ക്കുന്നതിനുപറയുന്ന പേരാണ് hallucination (മതിഭ്രമം) എന്നത്.

മനുഷ്യർക്ക് സങ്കലനപ്പട്ടിക എന്നത് ഹൃദിസ്ഥമാക്കിയ ഒരു ഓർമ മാത്രമല്ല. മനുഷ്യരെ സംബന്ധിച്ച്, പ്രപഞ്ചത്തിന്റെ മൗലികമായ ഘടനയെക്കുറിച്ചുള്ള ധാരണകളുടെ ഒരു രൂപം (Abstraction) കൂടിയാണത്. ഇത് ബൃഹദ് ഭാഷാ മാതൃകകൾക്ക് അന്യമാണ്. മുകളിൽ പറഞ്ഞ രീതിയിൽ pattern matching നടത്തിയും tool calling നടത്തിയുമാണ് അവ ഉത്തരം കണ്ടെത്താൻ ശ്രമിക്കുന്നത്. അതുകൊണ്ടുതന്നെ, സങ്കീർണമായ ഗണിതപരമോ യുക്തിപരമോ ആയ വിശകലനങ്ങൾ ആവശ്യമുള്ളിടത്ത്, ബൃഹദ് ഭാഷാമാതൃകകൾ പലപ്പോഴും യുക്തിസഹമല്ലാത്ത ഘട്ടങ്ങളിലൂടെ കടന്നുപോകുകയും (hallucination എന്ന് മുകളിൽ പറഞ്ഞത്), തെറ്റായ ഉത്തരങ്ങളെ വളരെ ആത്മവിശ്വാസത്തോടെ അവതരിപ്പിക്കുകയും ചെയ്യും.

ബൃഹദ് ഭാഷാമാതൃകകളോ അതിനെ അധിഷ്ഠിതമാക്കി നിർമിച്ചിട്ടുള്ള സങ്കേതങ്ങളോ (agents) മോശപ്പെട്ട സാങ്കേതികവിദ്യയാണോ? ഒട്ടുമല്ല. വലിയൊരു മുന്നേറ്റമാണ് അത് സൃഷ്ടിച്ചിട്ടുള്ളതെന്ന കാര്യത്തിൽ ഒരു തർക്കവുമില്ല. അതുൾപ്പെടെയുള്ള സാങ്കേതികവിദ്യകളെ (machine learning models, deep learning models etc) നിർമിത ബുദ്ധി എന്നു വിളിക്കുന്നത് പ്രശ്നമാണ്. അതുകൊണ്ടുതന്നെ, മനുഷ്യബുദ്ധിയെയും ഇത്തരം സ്റ്റാറ്റിസ്റ്റിക്കൽ മോഡലുകളെയും സമീകരിക്കുന്നത്, അപകടകരവുമാണ്.

ധവളപത്രം ബൃഹദ്‌ ഭാഷാമാതൃകകൾകൊണ്ട് നിർമിച്ചാലെന്താണ് പ്രശ്നം?
നിയമസഭയിൽ സർക്കാർ സമർപ്പിച്ച ധവളപത്രത്തിന്റെ വലിയൊരു ഭാഗവും “AI നിർമിതമാണ്’ എന്നതാണല്ലോ ചർച്ച. ധവളപത്രം പോലെയൊരു സുപ്രധാന രേഖ “തയ്യാറാക്കാൻ”, മനുഷ്യർ LLMകളുടെ “സഹായം തേടുന്നത്” സാധാരണ ഗതിയിൽ വലിയ  പ്രശ്നമുള്ള കാര്യമല്ല. എന്നാൽ അത് പ്രശ്നമുള്ളതാകുന്നത് എവിടെയാണ്?

സർക്കാരിന്റെ പ്രവർത്തനങ്ങളെ സംബന്ധിച്ച രഹസ്യരേഖകളും വിവരങ്ങളും സുരക്ഷിതമായി സൂക്ഷിക്കാൻ ഭരണഘടനാപരമായി സർക്കാരിനും മന്ത്രിസഭയ്ക്കും ഉത്തരവാദിത്വമുണ്ട്. അതൊക്കെ മറന്നുകൊണ്ട് സുപ്രധാനമായ രഹസ്യരേഖകൾ അലസമായി കൈകാര്യം ചെയ്തിട്ടുണ്ട് എങ്കിൽ അതീവഗുരുതരമായ സുരക്ഷാവീഴ്ചയാണത്. പ്രമുഖമായ എല്ലാ LLM സംവിധാനങ്ങളുടെയും ഡേറ്റാ സെന്ററുകൾ ഇന്ത്യയ്ക്ക് പുറത്താണ്. മിക്കവാറും LLMകളും നമ്മൾ നൽകുന്ന രേഖകളും നമ്മൾ നടത്തുന്ന സംഭാഷണങ്ങളും ബൃഹദ് ഭാഷാമാതൃകകൾ കൂടുതൽ മെച്ചപ്പെടുത്തുന്നതിനായി (മോഡൽ ട്രെയിനിങ്) ഉപയോഗിക്കും. അതുകൊണ്ടുതന്നെ ഈ രേഖകളുടെ രഹസ്യസ്വഭാവം അട്ടിമറിക്കപ്പെടുന്നു. സർക്കാർ രേഖകൾ വിദേശ സെർവറുകളിലേക്ക് നൽകുന്നത് Digital Personal Data Protection (DPDP) Act, 2023, IT Act 2000 (Sec 43A/72A), കൂടാതെ MeitY-യുടെ AI സുരക്ഷാ മാർഗനിർദ്ദേശങ്ങൾ എന്നിവയുടെ ഗുരുതരമായ ലംഘനമാണ്. സംസ്ഥാനത്തിന്റെ സാമ്പത്തിക രഹസ്യങ്ങൾ (Fiscal Data) വിദേശ LLM-കൾക്ക് നൽകുന്നത് ‘ഡാറ്റാ പരമാധികാരത്തിന്റെ’ (Data Sovereignty) നിയമപരമായി ലംഘനമാണ്.

പലരും ചോദിക്കുന്നത് ഈ LLM സ്വന്തം സിസ്റ്റത്തിൽ ഹോസ്റ്റ് ചെയ്താൽ ഈ വക പ്രശ്നം ഒന്നുമില്ലല്ലോ എന്നാണ്. തീർത്തും നിഷ്കളങ്കമാണ് ഈ ചോദ്യം. DeepSeek ഒഴികെയുള്ള പ്രശസ്തമായ മിക്ക ബൃഹദ് ഭാഷാ മാതൃകകളും closed ആണ്. ഇനി DeepSeekന്റെ latest version (v4) ഓടിക്കണമെന്നു വെച്ചാൽ തന്നെ വേണ്ടിവരുന്നത് കുറഞ്ഞത് 1 TB RAM, 16 NVIDIA H200 (141 GB) GPUകൾ, കുറഞ്ഞത് 2 TB എങ്കിലുമുള്ള NVMe സ്റ്റോറേജുകൾ എന്നിവയാണ്. ഇതിന് ഏകദേശം ചെലവ് വരുക (CapEx) 6-10 കോടി രൂപയാണ്. ഇത് ഓടിക്കാൻ ഏകദേശം 12 kW വൈദ്യുതി പിന്നെയും വേണം. തണുപ്പിക്കാനാകട്ടെ, മറ്റൊരു 4 കിലോവാട്ട് കൂടി വേണം ഇത് ഓടിക്കാൻ വേണ്ടി ഏകദേശം ഒരു ലക്ഷം രൂപ ഓരോ മാസവും വകയിരുത്തണം. മറ്റ് ചെലവുകൾ ഉൾപ്പെടുത്തുന്നില്ല (സ്ഥലവാടക, maintenance, human resources etc). കേരളത്തിൽ എവിടെയാണ് ഈ ഡാറ്റാ സെന്റർ സ്ഥിതിചെയ്യുന്നത്? അതിന്റെ logകൾ കാണിക്കാനുള്ള ധൈര്യം സർക്കാർ കാണിക്കുമോ?

ഇനി സ്വന്തം പുരയിടത്തിൽ തന്നെ LLM ഓടിച്ചു എന്നിരിക്കട്ടെ. അതിന്റെ logകളും ഉണ്ടെന്നിരിക്കട്ടെ. എങ്കിൽപോലും, പ്രസ്തുത രേഖ “നിർമിക്കാൻ” LLM ഉപയോഗിച്ചു എന്നത് അടിസ്ഥാന നൈതികതയുടെ ലംഘനമാണ്. ഏത് കാര്യവും, – അത് കോഡ് ആകട്ടെ, രേഖകളാകട്ടെ – LLM ഉപയോഗിച്ചുകൊണ്ട് നിർമിച്ചതായാലും അത് തുറന്നു സമ്മതിക്കുക എന്നതൊരു മര്യാദയാണ്. പൂർണമായും എന്റെ ബൗദ്ധികപ്രയത്നത്തിന്റെ ഫലമല്ല ഇത് എന്നു കാര്യം തുറന്നുപറയണം.

ഇനി അങ്ങനെ തന്നെയൊരു വെളിപ്പെടുത്തലുണ്ടായാലും ഇതുപോലെയൊരു സുപ്രധാന രേഖയുടെ കാതലായ ഭാഗങ്ങളൊക്കെ “AI Slop’ ആണ് എന്നു പറയുമ്പോൾ മനസ്സിലാകുന്നത്, സർക്കാരിന് ഇത് തയ്യാറാക്കുന്നതിലുണ്ടായ ഗൗരവമില്ലായ്മയാണ്.

ഭാവിയിൽ സർക്കാരിന്റെ പ്രവർത്തനങ്ങളിൽ LLM പോലെയുള്ള സാങ്കേതികവിദ്യകൾ ഉപയോഗിക്കരുതെന്ന് ഇതുകൊണ്ട് അർത്ഥമാക്കുന്നില്ല. മാനുഷികാദ്ധ്വാനം കുറയ്ക്കുന്ന എല്ലാ സാങ്കേതികവിദ്യകളും – അത് LLM ആയാലും EVM ആയാലും – വിവേചനബുദ്ധിയോടെ, സുതാര്യതയും സുരക്ഷയും ഉറപ്പാക്കി കൊണ്ട്, ഉത്തരവാദിത്വത്തോടെ പ്രയോജനപ്പെടുത്തണം.

എന്താണ് സർക്കാർ പ്രതിനിധികൾ നൽകുന്ന വിശദീകരണങ്ങൾ തൃപ്തികരമല്ലാത്തത്?
സെൻസിറ്റീവ് ആയ സർക്കാർ ഡാറ്റകളുടെമേല്‍ സ്വകാര്യ സാങ്കേതികസംവിധാനങ്ങളുടെ പരിമിതമായ ഉപയോഗംപോലും നിലവിലെ സുരക്ഷാ മാർഗനിർദ്ദേശങ്ങളുടെ ലംഘനമാണ്. ഇത് ഡാറ്റാ അപകടസാധ്യതകൾ സൃഷ്ടിക്കുകയും ചെയ്യുന്നു. “ഫോർമാറ്റിങ്ങിനുവേണ്ടി മാത്രം’ എന്ന ഒഴികഴിവ് അതുകൊണ്ടുതന്നെ വിലപ്പോവില്ല. അത് ഗുരുതരമായ വീഴ്ച തന്നെയാണ്.

ഏത് സെൻസിറ്റീവ് ഡാറ്റ ഏതൊക്കെ LLM സംവിധാനങ്ങളിലേക്കാണ് നല്‍കിയത്, ഏതൊക്കെ ഡാറ്റാ സുരക്ഷാ മാർഗനിർദേശങ്ങൾ പാലിച്ചാണ് ഇത് ചെയ്തത് എന്നൊക്കെയുള്ള പ്രധാനപ്പെട്ട ചോദ്യങ്ങൾക്ക് മറുപടി നൽകുന്നത് മനഃപൂർവ്വം ഒഴിവാക്കാൻ വേണ്ടിയാണ് കെ. എം. ചന്ദ്രശേഖറിന്റെ ഒഴുക്കൻ പ്രതികരണം എന്നത് വ്യക്തമാണ്. അതോടൊപ്പംതന്നെ, LLM പ്രയോഗമെന്ന ആരോപണത്തെ ‘അനുമോദനം’ ആയിട്ടാണ് അദ്ദേഹം ആ അഭിമുഖത്തിൽ വിശേഷിപ്പിക്കുന്നത്. ജനങ്ങളുടെ ന്യായമായ ആശങ്കകളെ ഈ വിധത്തിൽ തള്ളിക്കളയുന്നത് തികച്ചും നിരുത്തരവാദപരമാണ്. അല്ലെങ്കിലും, ഒരു സ്വകാര്യ കമ്പനിയുടെ ഉദ്യോഗസ്ഥനായ മുൻ കാബിനറ്റ് സെക്രട്ടറിക്ക് ജനങ്ങളോട് എന്തെങ്കിലും പ്രതിബദ്ധതയുണ്ടെന്നു കരുതുന്നത് തന്നെ ശരിയല്ല.

മനുഷ്യരെ ബാധിക്കുന്ന നയങ്ങളും നിയമങ്ങളും നിർമിക്കാൻ, ജനങ്ങളോട് യാതൊരു ഉത്തരവാദിത്വവുമില്ലാത്ത, തെറ്റുകൾ വരുത്താൻ സാധ്യതയുള്ള അൽഗോരിതങ്ങളെ (probabilistic algorithms) ഏൽപ്പിക്കുന്നത് ജനാധിപത്യത്തിന്റെ തന്നെ അടിവേരറുക്കുന്ന നടപടിയാണ്. നവീനസാങ്കേതികവിദ്യകളെ കണ്ണടച്ചെതിർക്കേണ്ട കാര്യം ഒരാധുനിക ജനസമൂഹം എന്ന നിലയിൽ നമുക്കില്ല. എന്നാൽ, സുതാര്യതയും സുരക്ഷിതത്വവും ഉറപ്പുവരുത്തിക്കൊണ്ട് അതിന്റെ പരിമിതികളെയും സമൂഹത്തില്‍ അത് സൃഷ്ടിക്കാൻ പോകുന്ന ആഘാതങ്ങളെയും മനസ്സിലാക്കിക്കൊണ്ട് ഉത്തരവാദിത്വത്തോടെയാവണം സാങ്കേതികവിദ്യ പ്രയോഗിക്കേണ്ടത്. നിർഭാഗ്യവശാൽ, ഭരണഘടനാപരമായ ആ ഉത്തരവാദിത്വം ഇവിടെ വിസ്മരിക്കപ്പെട്ടിരിക്കുന്നു. l

ARTICLES

LEAVE A REPLY

Please enter your comment!
Please enter your name here

four + 19 =

Most Popular