‘এ আই’, ‘এ জি আই’ প্রসঙ্গে ইয়ান লেকুন

‘এ আই’, ‘এ জি আই’ প্রসঙ্গে ইয়ান লেকুন

অমিতাভ দত্ত
প্রফেসর, স্কুল অব ফিজিক্স, ম্যাথমেটিক্‌স অ্যান্ড কম্পিউটার সায়েন্স, ইউনিভার্সিটি অব ওয়েস্টার্ন অস্ট্রেলিয়া
Posted on ৫ এপ্রিল, ২০২৫

ইদানীং এ আই এবং এ জি আই (আর্টিফিশিয়াল জেনারেল ইন্টেলিজেন্স, কৃত্রিম সার্বিক বুদ্ধিমত্তা) নিয়ে প্রচুর প্রত্যাশা জেগে উঠেছে এবং প্রচুর হৈচৈ হচ্ছে। ভালোই হচ্ছে। কিন্তু এর অন্তর্লীন বিজ্ঞানটা প্রায়ই প্রচারমাধ্যমে ভুলভাবে উপস্থাপিত হচ্ছে। এমনকি বিজ্ঞানের খবরগুলোও আজকাল চটক আর রোমাঞ্চকরতার দিকে ঝুঁকে পড়েছে। খুবই প্রভাবশালী মানুষজনও সব সময় এ ব্যাপারে খুব সাহায্য করছেন না। যেমন ধরুন কোনো নোবেলজয়ী বলছেন, সামনের দশ বছরের মধ্যেই নাকি সব অসুখবিসুখ সারিয়ে দেবে এ আই কিংবা ডেকে আনবে বিশ্ব বিপর্যয়। এসব কথা ব্যাপক প্রচার পায়। কিন্তু এসব কথার মধ্যে যুক্তির ফাঁকিটা যখন অন্য বিজ্ঞানীরা ধরিয়ে দেন, তখন সেগুলো বিশেষ প্রচার পায় না। তাই একজন বিশিষ্ট বিজ্ঞানী যখন এ আই এবং এ জি আই সম্পর্কে ধারণাটা পরিষ্কার করবার জন্য এগিয়ে এলেন সেটা খুবই স্বস্তির বিষয়। কিন্তু এর মধ্যে তো কোনো চটক নেই, তাই এটি প্রচারও পেল না। দিন কয়েক আগে মেটা এ আই-এর প্রধান বিজ্ঞানী ইয়ান লেকুন একটি চমৎকার সাক্ষাৎকার দিয়েছেন। এ আই বিষয়ে জানতে আগ্রহী যেকোনো লোকেরই এটি সম্বন্ধে জানা উচিত।
ডিপ লার্নিং নিয়ে লেকুন-এর বুনিয়াদী স্তরের কাজ রয়েছে। যে-‘কনভোলিউশনাল নিউরাল নেটওয়ার্ক’ (জটিল-কুটিল স্নায়ুজালিকা) আজ আমাদের নিত্যদিনের সঙ্গী, তিনিই সেটির স্রষ্টা। তিনি লার্জ ল্যাঙ্গুয়েজ মডেলের অন্তর্লীন বিজ্ঞানটি অতি সুন্দরভাবে বুঝিয়েছেন। চার ধরনের ডিপ নেটওয়ার্ক আজকাল খবরের শিরোনামে। একটি হল তত্ত্বাবধানযুক্ত ‘সুপারভাইজ্‌ড লার্নিং নেটওয়ার্ক’। বহু উদাহরণ দেখিয়ে এগুলিকে তালিম দেওয়া হয়। তার ফলে এরা চিত্ররূপগুলোকে বর্গে বর্গে সাজিয়ে নিতে পারে। দ্বিতীয়টি হল বিনা তত্ত্বাবধানে ‘আন-সুপারভাইজ্‌ড লার্নিং’। এটা এক প্রশস্ত ক্ষেত্র, যাকে অজানা ডেটা অনুধাবনের কাজে লাগানো হয়। তৃতীয়টা হল ‘রি-ইনফোর্স্‌ড লার্নিং’। এর ব্যবহার খুব ব্যাপক নয়। মূলত গেম খেলাতেই এর প্রয়োগ সীমাবদ্ধ। চতুর্থটা হল আধা-সুপারভাইজ্‌ড লার্নিং। এটিই লার্জ ল্যাঙ্গুয়েজ মডেল (এল এল এম)-এর ভিত্তি। এখানেও প্রচুর উদাহরণ দেখানো হয়, কিন্তু সেগুলোর পরিচয় জানানো হয় না। নেটওয়ার্কটা এর গভীরে লীন কাঠামোটাকে (যেমন ইংরেজির মতো স্বাভাবিক ভাষার কাঠামো ) বুঝে নিয়ে পরের পর্যায়ের শব্দগুলো তৈরি করে নেয়। চ্যাটবটের এই ধরণের কাজের সঙ্গে আমরা সকলেই পরিচিত। লেকুন এসবের খুঁটিনাটি সবই অনবদ্যভাবে ব্যাখ্যা করেছেন, কিন্তু এখানে সেসব কথায় যাওয়ার অবকাশ নেই। তার চেয়ে বরং তিনি যেভাবে এই এল এল এম-এর কেন্দ্রীয় সীমবদ্ধতাটিকে ব্যাখ্যা করেছেন সেই প্রসঙ্গে আসি।
এল এল এম একটা অভাবনীয় জিনিস, সত্যিই মাথা ঘুরিয়ে দেওয়ার মতো। কিন্তু তারা এই ভৌত জগতটা সম্বন্ধে কিছুই শিখে নিতে পারে না। ইন্টারনেটে উপস্থিত নির্ভুল বাক্যবিন্যাসগুলিতে লক্ষ কোটি কথাচিত্র আর শব্দ যেভাবে হাজির হয়, শুধু সেটার ভিত্তিতেই সে তালিম পেয়েছে। এ সম্ভার অতি বিপুল সন্দেহ নেই, তবু সসীম। উপযুক্ত মাত্রায় কম্পিউটিং শক্তি থাকলে কম্পিউটারের পক্ষে এই ছাঁদগুলো আর তার অনুবর্তী শব্দচিহ্ণগুলো শিখে নিয়ে নতুন শব্দ তৈরি করা সম্ভব। আমরা জানি, এ এক বিরাট কৃতিত্ব। কিন্তু এর সঙ্গে বিশ্ব সংক্রান্ত জ্ঞানের কোনো সম্পর্ক নেই। এল এল এম যে কী করে শিক্ষালাভ করে তা আমরা বুঝতে পারি না ঠিকই, কিন্তু স্বজ্ঞা দিয়ে এটুকু বুঝতে পারি যে শব্দগুলোকে সাজিয়ে নেওয়ার পথগুলোর সংখ্যা অসীম নয়, যদিও খুবই বড়ো।
লেকুন জানান, এল এল এম-এর প্রশিক্ষণ-সম্ভারে সেসব তথ্য থাকে তা একটা চার বছরের মানবশিশু তার ইন্দ্রিয় মারফত যে তথ্য সংগ্রহ করেছে তার সমতুল্য। (লেকুন অবশ্য এ ব্যাপারটা উল্লেখ করেননি যে মানবশিশুটি মাত্র ২০০-৩০০ ওয়াট ব্যবহার করে তথ্য সংগ্রহ করে, আর এল এল এম করে গিগা বাইটের এককে)। তফাত এই, মানবশিশু বিশ্বের একটা প্রতিচ্ছবি তৈরি করে নেয়, যা এল এল এম-এর সাধ্যাতীত। তিনি একটা উদাহরণ দিয়েছেন। ওই একই আধা-সুপারভাইজড লার্নিং পরিমার্গ (অ্যাপ্রোচ) কিন্তু বিশ্ব সম্বন্ধে জ্ঞানকে সাজিয়েগুছিয়ে তুলতে আপরগ। বিশ্ব সংক্রান্ত জ্ঞান এককথায় অতিবৃহৎ, অসীম, তাই কী ভাবে ওই আধা-সুপারভাইজড মডেলকে এ ব্যাপারে প্রশিক্ষণ দেওয়া যাবে সে বিষয়ে আমরা একেবারেই কিছু জানি না। ওই একই পরিমার্গর ভিত্তিতে প্রশিক্ষণ দিয়ে দেখা গেছে, একটা ভিডিওতে পরের দৃশ্যগুলি কী হবে তা আন্দাজ করতে একেবারেই অক্ষম এল এল এম-গুলি।
এটা নতুন কিছু নয়। এ আই তো নতুন জিনিস নয়, নতুন কেবল এই প্রচার ধামাকাটা। এ আই গবেষকরা গত ষাট বছরেরও বেশি সময় ধরে চেষ্টা চালিয়ে যাচ্ছেন কী করে বিশ্ব সংক্রান্ত জ্ঞানের একটা মডেল বানানো যায়। বুদ্ধিমত্তা একটা অবাক-করা জিনিস এজন্য নয় তা তাজ্জব-বানানো কাণ্ড ঘটায়। বুদ্ধিমত্তার আসল অবাক-করা বৈশিষ্ট্য হল এই যে আমরা, ইঁদুররা, প্রজাপতিরা সকলেই আমাদের ইন্দ্রিয়গুলি মারফত এই জগতটাকে প্রক্রিয়াকরণ করে নিয়ে বেঁচেবর্তে থাকি। আমরা মানুষরা ভাষার ওপর প্রচুর গুরুত্ব দিই অন্যদের চমকে দেওয়ার জন্য নয়, বিশ্বের জিনিসগুলিকে মূল্য দেওয়ার কৃষ্টিগত প্রবণতার জন্য। লেকুন এল এল এমকে তারিফ করেন, আমিও করি। এটা সত্যিই তাজ্জব করে দেওয়ার মতো ব্যাপার যে মেশিন আজ অতি-মানব স্তরে ভাষা তৈরি করতে পারছে। কিন্তু তা সত্ত্বেও (এখনো পর্যন্ত) বিশ্ব সংক্রান্ত জ্ঞান আয়ত্ত করা মেশিনের সাধ্যাতীত।

Leave a Reply

Your email address will not be published. Required fields are marked *

seven − seven =