
ইদানীং এ আই এবং এ জি আই (আর্টিফিশিয়াল জেনারেল ইন্টেলিজেন্স, কৃত্রিম সার্বিক বুদ্ধিমত্তা) নিয়ে প্রচুর প্রত্যাশা জেগে উঠেছে এবং প্রচুর হৈচৈ হচ্ছে। ভালোই হচ্ছে। কিন্তু এর অন্তর্লীন বিজ্ঞানটা প্রায়ই প্রচারমাধ্যমে ভুলভাবে উপস্থাপিত হচ্ছে। এমনকি বিজ্ঞানের খবরগুলোও আজকাল চটক আর রোমাঞ্চকরতার দিকে ঝুঁকে পড়েছে। খুবই প্রভাবশালী মানুষজনও সব সময় এ ব্যাপারে খুব সাহায্য করছেন না। যেমন ধরুন কোনো নোবেলজয়ী বলছেন, সামনের দশ বছরের মধ্যেই নাকি সব অসুখবিসুখ সারিয়ে দেবে এ আই কিংবা ডেকে আনবে বিশ্ব বিপর্যয়। এসব কথা ব্যাপক প্রচার পায়। কিন্তু এসব কথার মধ্যে যুক্তির ফাঁকিটা যখন অন্য বিজ্ঞানীরা ধরিয়ে দেন, তখন সেগুলো বিশেষ প্রচার পায় না। তাই একজন বিশিষ্ট বিজ্ঞানী যখন এ আই এবং এ জি আই সম্পর্কে ধারণাটা পরিষ্কার করবার জন্য এগিয়ে এলেন সেটা খুবই স্বস্তির বিষয়। কিন্তু এর মধ্যে তো কোনো চটক নেই, তাই এটি প্রচারও পেল না। দিন কয়েক আগে মেটা এ আই-এর প্রধান বিজ্ঞানী ইয়ান লেকুন একটি চমৎকার সাক্ষাৎকার দিয়েছেন। এ আই বিষয়ে জানতে আগ্রহী যেকোনো লোকেরই এটি সম্বন্ধে জানা উচিত।
ডিপ লার্নিং নিয়ে লেকুন-এর বুনিয়াদী স্তরের কাজ রয়েছে। যে-‘কনভোলিউশনাল নিউরাল নেটওয়ার্ক’ (জটিল-কুটিল স্নায়ুজালিকা) আজ আমাদের নিত্যদিনের সঙ্গী, তিনিই সেটির স্রষ্টা। তিনি লার্জ ল্যাঙ্গুয়েজ মডেলের অন্তর্লীন বিজ্ঞানটি অতি সুন্দরভাবে বুঝিয়েছেন। চার ধরনের ডিপ নেটওয়ার্ক আজকাল খবরের শিরোনামে। একটি হল তত্ত্বাবধানযুক্ত ‘সুপারভাইজ্ড লার্নিং নেটওয়ার্ক’। বহু উদাহরণ দেখিয়ে এগুলিকে তালিম দেওয়া হয়। তার ফলে এরা চিত্ররূপগুলোকে বর্গে বর্গে সাজিয়ে নিতে পারে। দ্বিতীয়টি হল বিনা তত্ত্বাবধানে ‘আন-সুপারভাইজ্ড লার্নিং’। এটা এক প্রশস্ত ক্ষেত্র, যাকে অজানা ডেটা অনুধাবনের কাজে লাগানো হয়। তৃতীয়টা হল ‘রি-ইনফোর্স্ড লার্নিং’। এর ব্যবহার খুব ব্যাপক নয়। মূলত গেম খেলাতেই এর প্রয়োগ সীমাবদ্ধ। চতুর্থটা হল আধা-সুপারভাইজ্ড লার্নিং। এটিই লার্জ ল্যাঙ্গুয়েজ মডেল (এল এল এম)-এর ভিত্তি। এখানেও প্রচুর উদাহরণ দেখানো হয়, কিন্তু সেগুলোর পরিচয় জানানো হয় না। নেটওয়ার্কটা এর গভীরে লীন কাঠামোটাকে (যেমন ইংরেজির মতো স্বাভাবিক ভাষার কাঠামো ) বুঝে নিয়ে পরের পর্যায়ের শব্দগুলো তৈরি করে নেয়। চ্যাটবটের এই ধরণের কাজের সঙ্গে আমরা সকলেই পরিচিত। লেকুন এসবের খুঁটিনাটি সবই অনবদ্যভাবে ব্যাখ্যা করেছেন, কিন্তু এখানে সেসব কথায় যাওয়ার অবকাশ নেই। তার চেয়ে বরং তিনি যেভাবে এই এল এল এম-এর কেন্দ্রীয় সীমবদ্ধতাটিকে ব্যাখ্যা করেছেন সেই প্রসঙ্গে আসি।
এল এল এম একটা অভাবনীয় জিনিস, সত্যিই মাথা ঘুরিয়ে দেওয়ার মতো। কিন্তু তারা এই ভৌত জগতটা সম্বন্ধে কিছুই শিখে নিতে পারে না। ইন্টারনেটে উপস্থিত নির্ভুল বাক্যবিন্যাসগুলিতে লক্ষ কোটি কথাচিত্র আর শব্দ যেভাবে হাজির হয়, শুধু সেটার ভিত্তিতেই সে তালিম পেয়েছে। এ সম্ভার অতি বিপুল সন্দেহ নেই, তবু সসীম। উপযুক্ত মাত্রায় কম্পিউটিং শক্তি থাকলে কম্পিউটারের পক্ষে এই ছাঁদগুলো আর তার অনুবর্তী শব্দচিহ্ণগুলো শিখে নিয়ে নতুন শব্দ তৈরি করা সম্ভব। আমরা জানি, এ এক বিরাট কৃতিত্ব। কিন্তু এর সঙ্গে বিশ্ব সংক্রান্ত জ্ঞানের কোনো সম্পর্ক নেই। এল এল এম যে কী করে শিক্ষালাভ করে তা আমরা বুঝতে পারি না ঠিকই, কিন্তু স্বজ্ঞা দিয়ে এটুকু বুঝতে পারি যে শব্দগুলোকে সাজিয়ে নেওয়ার পথগুলোর সংখ্যা অসীম নয়, যদিও খুবই বড়ো।
লেকুন জানান, এল এল এম-এর প্রশিক্ষণ-সম্ভারে সেসব তথ্য থাকে তা একটা চার বছরের মানবশিশু তার ইন্দ্রিয় মারফত যে তথ্য সংগ্রহ করেছে তার সমতুল্য। (লেকুন অবশ্য এ ব্যাপারটা উল্লেখ করেননি যে মানবশিশুটি মাত্র ২০০-৩০০ ওয়াট ব্যবহার করে তথ্য সংগ্রহ করে, আর এল এল এম করে গিগা বাইটের এককে)। তফাত এই, মানবশিশু বিশ্বের একটা প্রতিচ্ছবি তৈরি করে নেয়, যা এল এল এম-এর সাধ্যাতীত। তিনি একটা উদাহরণ দিয়েছেন। ওই একই আধা-সুপারভাইজড লার্নিং পরিমার্গ (অ্যাপ্রোচ) কিন্তু বিশ্ব সম্বন্ধে জ্ঞানকে সাজিয়েগুছিয়ে তুলতে আপরগ। বিশ্ব সংক্রান্ত জ্ঞান এককথায় অতিবৃহৎ, অসীম, তাই কী ভাবে ওই আধা-সুপারভাইজড মডেলকে এ ব্যাপারে প্রশিক্ষণ দেওয়া যাবে সে বিষয়ে আমরা একেবারেই কিছু জানি না। ওই একই পরিমার্গর ভিত্তিতে প্রশিক্ষণ দিয়ে দেখা গেছে, একটা ভিডিওতে পরের দৃশ্যগুলি কী হবে তা আন্দাজ করতে একেবারেই অক্ষম এল এল এম-গুলি।
এটা নতুন কিছু নয়। এ আই তো নতুন জিনিস নয়, নতুন কেবল এই প্রচার ধামাকাটা। এ আই গবেষকরা গত ষাট বছরেরও বেশি সময় ধরে চেষ্টা চালিয়ে যাচ্ছেন কী করে বিশ্ব সংক্রান্ত জ্ঞানের একটা মডেল বানানো যায়। বুদ্ধিমত্তা একটা অবাক-করা জিনিস এজন্য নয় তা তাজ্জব-বানানো কাণ্ড ঘটায়। বুদ্ধিমত্তার আসল অবাক-করা বৈশিষ্ট্য হল এই যে আমরা, ইঁদুররা, প্রজাপতিরা সকলেই আমাদের ইন্দ্রিয়গুলি মারফত এই জগতটাকে প্রক্রিয়াকরণ করে নিয়ে বেঁচেবর্তে থাকি। আমরা মানুষরা ভাষার ওপর প্রচুর গুরুত্ব দিই অন্যদের চমকে দেওয়ার জন্য নয়, বিশ্বের জিনিসগুলিকে মূল্য দেওয়ার কৃষ্টিগত প্রবণতার জন্য। লেকুন এল এল এমকে তারিফ করেন, আমিও করি। এটা সত্যিই তাজ্জব করে দেওয়ার মতো ব্যাপার যে মেশিন আজ অতি-মানব স্তরে ভাষা তৈরি করতে পারছে। কিন্তু তা সত্ত্বেও (এখনো পর্যন্ত) বিশ্ব সংক্রান্ত জ্ঞান আয়ত্ত করা মেশিনের সাধ্যাতীত।