AI এসে গেছে (পর্ব ৩) 

AI এসে গেছে (পর্ব ৩) 

অভিজিৎ কর গুপ্ত
পদার্থ বিজ্ঞানের অধ্যাপক, পাঁশকুড়া বনমালী কলেজ (অটোনমাস)
Posted on ৩ মে, ২০২৬

কোন কিছু জানা মানে হচ্ছে সেই জিনিসটাকে মনে রাখা। কোন কিছু বোঝা মানে হলো, বিষয়টাকে মাথার মধ্যে খেলাতে পারা, তার সাথে আমাদের অভিজ্ঞতাকে যুক্ত করা, মনে মনে বুঝে নেওয়া এরকম হলে কী হবে, ওরকম হলে কী পরিবর্তন হবে ইত্যাদি। আমাদের বাস্তব অভিজ্ঞতার জগৎ ত্রিমাত্রিক। এর বেশি মাত্রার কিছু আমরা ধারণা করতে পারি না। কিন্তু, AI তার হিসাবনিকাশ করে বহুমাত্রিক স্পেসে। হাজার হাজার ডাইমেনশান। একটা ছবি বা লেখা বা অডিও বা যা কিছু ইনপুট দেওয়া হোক তাকে বিভিন্ন ফিচার-এর বহুমাত্রিক স্পেসে ফেলে সে কম্পিউটেশান করে। একটা ব্যাপার কল্পনা করে নিতে পারি, একটা হাজার হাজার ডাইমেনশানের স্পেস, বিশাল বিস্তৃত এক আয়তনের ব্যাপার যেখানে দুনিয়ার চেনাজানা নাম বা বস্তুগুলো খুব অল্প জায়গা নিয়ে একেকটা ছোট্ট ছোট্ট ক্লাসটারে অবস্থান করছে আর বেশিরভাগ জায়গাই ফাঁকা। ঠিক যেন আমাদের এই মহাজগতের মতো। এই বহুমাত্রিক ফাঁকা স্পেসে যেন এ. আই. বিচরন করছে, আর ফাঁকা জায়গার কোথাও গিয়ে হয়ত সে পৌঁছাচ্ছে কখনো, সম্ভাব্যতার পথ ধরে। মনে রাখতে হবে, AI সত্য (Truth) অনুসন্ধান করে না, সম্ভাব্যতা (Probability) অনুযায়ী একটা জায়গায় গিয়ে পৌঁছায়। বহুমাত্রার জগতে হয়ত কখনো কোথাও গিয়ে সে থামছে আর নতুন কিছু খুঁজে বার করছে যা আমাদের ত্রিমাত্রিক ভাবনাতে ধরা পড়ছে না। বহুমাত্রিক স্পেসে বিষয়গুলো অনেক দূরে দূরে, তারা হয়ত আলাদা হয়ে যাচ্ছে, কাজেই তফাৎ করা যাচ্ছে, অন্যভাবে চেনা যাচ্ছে তাদের, তাদের ভিতরকার অচেনা সম্পর্ক। এই যে বহুমাত্রার স্পেসে একটা কিছু সমাধানের বা সৃষ্টির উদ্দেশ্যে সম্ভাব্য পথ খুঁজে কোথাও পৌঁছতে চাওয়া তা আমাদের কল্পনাতে ধরা দেবে কী করে? অসম্ভব একটা ব্যাপার! এখানেই কীভাবে AI তার এই নিজস্ব বহুমাত্রিক জগতে ‘চিন্তা’ করছে তা বোঝার জন্য একটা গ্যাপ থেকে যাচ্ছে।

 

মানুষের মস্তিষ্ক হলো গল্প বলার মেশিন। আমাদের বোঝাপড়ার ক্ষেত্রে একটা গল্পের দরকার হয়। কোন কারণ আর তার পরিণাম (cause and effect)-কে যুক্ত করে আমরা বুঝে নিতে চাই কোন বিষয়কে। যেমন ধরা যাক, আগুন বললেই আমাদের মস্তিষ্কে উত্তাপ বা পুড়ে যাওয়ার একটা ছবি ভেসে ওঠে। আমরা বস্তুজগতের সাথে সম্পর্ক স্থাপন করি। আগুনের রাসায়নিক ফর্মূলা নিয়ে ভাবনা আসে পরে। আর, AI-এর কাছে কোন বিষয় স্বভাবতই আখ্যানহীন (no narrative)! AI যখন কোন বিষয় বুঝে সিদ্ধান্ত নেয় বা কোন কিছু সৃষ্টি করে তা সে করে নানারকম অঙ্ক আর এলগোরিদমের মাধ্যমে। এর সাথে কোন আখ্যান যুক্ত থাকে না। একেবারে আমাদের উলটো। তবে যে সিদ্ধান্তে সে পৌঁছাচ্ছে, বা যেসব সৃষ্টিশীল কাজ সে করছে, তা থেকে তো বোঝার উপায় থাকে না সেসব মানুষ না মেশিন কে করেছে।

 

কোন কিছু বুঝতে পারলে আমাদের একটা সজ্ঞান তৃপ্তি হয়। নতুন কোন ইনফরমেশন এলে তাকে যদি আমরা আমাদের বিশ্বাসের প্রেক্ষাপটে স্থান দিতে পারি তাহলে আমরা ভাবি, আহা! এই তো বুঝেছি! তা না হলে যেন একটা মানসিক সংঘাত চলতে থাকে। যেভাবেই হোক, একটা নতুন ভাবনাকে হয় তার আকার আকৃতির পরিবর্তন করে আমাদের বিশ্বাসের বা অভিজ্ঞতার ক্যানভাসে স্থান দেওয়া অথবা আমাদের অভিজ্ঞতার ক্যানভাসটাকে একটু বিস্তৃত করে তাকে স্থাপন করা – এই হলো আমাদের বোঝার ব্যাপার। দার্শনিকরা হয়ত বলবেন, understanding বা বোঝার ব্যাপারটা স্থির বা অচল কোন বিষয় নয়। Understanding কোন সত্যকে ধরতে যাওয়ার ব্যাপার না। তা হলো একটা relationship! আমাদের জাগতিক অভিজ্ঞতার সাথে সম্পর্ক স্থাপন করা। AI-এর ক্ষেত্রে অবশ্যই এসব কোন ব্যাপার নেই। তাহলে AI কি understand করে না, নাকি অন্যভাবে করে? অথবা প্রশ্ন করতে পারি, understanding-এর কি একটাই পথ, ঠিক আমরা যেভাবে বুঝি? অন্য কোনভাবে সম্ভব নয়?

 

আসলে, আমাদের সংস্কৃতিতে এইরকম একটা বৈপ্লবিক সময়ে আমরা দেখছি AI-এর নানান কর্মকান্ড ক্রমাগত আমাদেরকে একেকটা চ্যালেঞ্জের মুখোমুখি দাঁড় করিয়ে দিচ্ছে। আমাদের সভ্যতার সুদীর্ঘ ইতিহাসে, আমাদের সমস্ত প্রাথমিক ধারণাগুলোকে নিয়ে নতুন করে ভাবার যেন সময় এসেছে। Understanding কী, meaning কী, thinking কী? জ্ঞান ও সৃষ্টির ক্ষেত্রে এরকম অনেককিছুর ভিত্তি নিয়ে আমাদের হয়ত নতুন করে অনুসন্ধান চালানো দরকার। যদি বলা হয়, understanding মানে শুধু সবকিছু খুঁটিনাটি জানা নয়, খেলার নিয়মটা (rule of the game) কী সেটা বুঝতে পারলেই হলো, তাহলে হয়ত AI বহুমাত্রার স্পেসে কীভাবে একেকটা রাস্তা খুঁজে কোথাও পৌঁছাচ্ছে তার খানিকটা আমরা ধারণাতে আনতে পারি।

 

আসলে, আমরা বুঝতে চাইছি AI তথা একটা কৃত্রিম নিউরাল নেটওয়ার্ক ঠিক কীভাবে কাজটা করছে। অত্যন্ত জটিল একটা সিস্টেম (Complex system), তার ভিতরে কী হচ্ছে তা ধরে ধরে বোঝা খুব কঠিন। কাজেই তা যেন আমাদের কাছে একটা ব্ল্যাক বক্স! অথচ একটা কৃত্রিম নিউরন খুব সহজ একটা কনসেপ্ট। কিছু ইনপুট ইনফরমেশান, হতে পারে কোন গল্প, কবিতা, আবেগ, সেন্টিমেন্ট অথবা কিছু সিম্বল বা অঙ্ক, বা ছবি, অডিও, ভিডিও ইত্যাদি। যা কিছুই হোক এসব কম্পিউটারের কাছে সংখ্যার একেকটি সংগ্রহ ছাড়া আর কিছুই নয়। এইসব সংগ্রহকে বিভিন্ন স্তরে সাজিয়ে বোঝার চেষ্টা আর তা দিয়ে অঙ্ক করা। একমাত্রিক অর্থাৎ এক লাইনে সাজিয়ে রাখলে আমরা বলি ভেক্টর। একটা এক্সেল শীট-এর মতো রো আর কলাম হিসাবে সাজিয়ে পরিবেশন করলে তা হলো দ্বিমাত্রিক যাকে আমরা মেট্রিক্স বলি। আবার একটা রঙিন ছবি হলো ত্রিমাত্রিক, কেননা তা তিনরকম রঙের (লাল, সবুজ, নীল) পিক্সেল দিয়ে তৈরি করা তিনটে মেট্রিক্স-এর সংমিশ্রণ। আবার একটা ভিডিও হবে চারমাত্রিক ইত্যাদি। যাই হোক, একটা নিউরনের নানান ইনপুট চ্যানেল দিয়ে এরকম সংখ্যাগুলো ঢুকছে, এরপর নিউরন এক একটা গুণক দিয়ে গুণ করে নিচ্ছে, তারপর সব যোগ করে তার সাথে নিজস্ব বায়াস যোগ করছে। এইসব প্রভাবশালী গুণকগুলো এবং বায়াস – এদের একসাথে গুণক (weights)-ই বলা যাক। এই অবধি ব্যাপারটা লিনিয়ার বা রৈখিক। সরলরেখার ফর্মূলাতে ফেলে দেখা যায় কী চলছে: y = w.x + b, এখানে w, b এরাই হলো সেইসব গুণক, আর x যদি ইনপুট হয়, y হলো আউটপুট। কিন্তু, এরপর দেখতে হবে প্রতিটা নিউরনের সিদ্ধান্ত নেওয়ার ক্ষমতা – সে ফায়ার করবে কী করবে না, উজ্জীবিত হয়ে তার সঙ্গে যুক্ত অন্য নিউরনদের মধ্যে ইনফরমেশন শেয়ার করবে কিনা। আসলে, এভাবেই ঢুকে পড়ছে ননলিনিয়ারিটি। অসংখ্য ননলিনিয়ার এলিমেন্ট পরষ্পর যুক্ত হয়ে শেষে একটা অসম্ভব জটিল সিস্টেম (Complex system) তৈরি হচ্ছে আর তা একসময় আমাদের বোধগম্যতার সীমা ছাড়িয়ে যাচ্ছে। এখানেই শেষ নয়। এই কৃত্রিম নিউরাল নেটওয়ার্ক বা কৃত্রিম মস্তিষ্ক কীভাবে সব শিখতে শুরু করে তাও একটু বোঝা দরকার। নানা ধরণের ইনফরমেশান (নানানরকমের তথ্য) ইনপুটে দিয়ে তারপর আউটপুট চেক করা হয়, কখনো তথ্যকে চিনিয়ে দেওয়া হয় লেবেল দিয়ে, কখনো নেটওয়ার্কই আবিষ্কার করে নেয় তথ্যের মধ্যে লুকিয়ে থাকা কোন প্যাটার্ন। প্রচন্ড পরিমাণে ট্রেনিং করা হয় একেকটি বিশাল নেটওয়ার্ক-কে, যা অসম্ভব খরচা সাপেক্ষও বটে। এরপর কতটা ভুল হচ্ছে দেখা হয়। ভুল বা লস-এর হিসাব রাখা হয়। কিভাবে নেটওয়ার্ক-এর গুণকগুলোকে একটু একটু করে কমিয়ে বাড়িয়ে নিয়ন্ত্রণ করলে আউটপুটে ভুলের পরিমাণ কমিয়ে আনা যায় এসব দেখা হয়। ব্যাপারটা মোটেই সহজ কাজ নয়। তবে, এ নিয়ে অনেক ইঞ্জিনিয়ারিং, অনেক গবেষণা অনবরত চলতে থাকে।

 

এখনকার একেকটি বড় বড় AI (যেমন chatGPT, Gemini, Copilot, Claude, Deepseek…)-এর কৃত্রিম নিউরাল নেটওয়ার্কে যত নিউরন থাকে, যতগুলো নিউরনের স্তর বা লেয়ার থাকে এবং তারা একে অপরের সাথে যেভাবে সংযুক্ত থাকে সেসব থেকে হিসাব করলে মোটামুটি একটা আন্দাজ করা যাবে কত গুণক থাকতে পারে। অবশ্য, নেটওয়ার্ক-এর নানারকম আর্কিটেকচার হয়। সবাই সবার সাথে সংযুক্ত থাকলে তা একরকম ব্যাপার (fully connected network), তারপর কোন স্তরে কতগুলো নিউরন থাকবে, কার সাথে কার কানেকশান থাকবে, কিভাবে স্তরগুলো বিন্যস্ত হবে এসব নানান হিসাব আছে। তবে, এখনকার দিনে আধুনিক বড় মাপের AI গুলো সব বহুমুখী (multimodal)! অনেকরকম আর্কিটেকচার, অনেক ধরণের এলগোরিদম, অনেক মডেলের সংমিশ্রণ থাকে। আর আছে নানান ইঞ্জিনিয়ারিং টেকনিক, অঙ্কের হিসাবনিকাশ। ভাবা যেতে পারে, নানান স্পেশ্যালিস্ট বা নানাধরণের বিশেষজ্ঞদের একটা টীম যাদের মধ্যে কাজ ভাগ হয়ে যাচ্ছে, তারপর তাদের মধ্যে সমন্বয় সাধন করা হচ্ছে আর আমরা শেষে কিছু সমাধান বা সৃষ্টি দেখতে পাচ্ছি। এসব নিয়ে এখন লিখছি না, পরে আলোচনা করা যাবে। শুধু গুণকগুলো কত সংখ্যায় থাকতে পারে তার একটা আইডিয়া দেওয়া যাক। তবে অবশ্য, কোন AI কোম্পানি ( OpenAI, Google, Anthropic, Microsoft…) তাদের নিউরাল নেটওয়ার্কের বিষয়ে বিস্তারিত হিসাব কখনো প্রকাশ করে না। এগুলো সব সিক্রেট! এখানে একটা বেশ কোল্ড ওয়ার-এর মতো ব্যাপার চলে!

 

একটা কথা মাথায় রাখতে হবে, এই কৃত্রিম নেটওয়ার্কই হলো ব্রেইন বা মস্তিষ্ক! এখানেই সবকিছু ঘটছে। একটা ব্যাপার দেখা যাচ্ছে, ব্রেইন যত বড় হচ্ছে, মানে নেটওয়ার্কের সাইজ বা গুণকের সংখ্যা যত বেশি হচ্ছে ততই AI-এর পারদর্শিতা আর কাজের নতুন নতুন দিক খুলে যাচ্ছে। এটাকে এক কথায় স্কেলিং বলা হয়। বড়ো, আরো বড়ো, আরো আরো বড়। এসবের জন্য বিশাল আয়তনের ডাটা সেন্টার তৈরি করতে হয় যেখানে বিশেষভাবে ডিজাইন করা অসংখ্য Graphics Processor Unit (GPU) ওলা সারি সারি কম্পিউটার বসাতে হয়। এইসব কর্মকান্ডের জন্য যে বিশাল পরিমাণ পাওয়ার সাপ্লাই দরকার হয় তা সত্যিই অকল্পনীয়! অনেক গিগাওয়াট পাওয়ার লাগে যা একটা ছোটখাটো শহরের ইলেক্ট্রিসিটির চাহিদার সমান। অন্যদিকে আমাদের মস্তিষ্ক মাত্র ২০ ওয়াট পাওয়ার নিয়েই কত কিছু কাজ করে ফেলছে! তবে, আমরা কী পারি আর কী পারি না, মেশিন কী পারে আর কী পারে না এই ব্যাপারগুলো মাথায় রাখতে হবে।

 

মোটামুটি একটা ধারণা দেওয়া যাক। কোন AI-এর নিউরাল নেটওয়ার্কের গুণক বা প্যারামিটারগুলোর সংখ্যা 125 মিলিয়ন – 1 বিলিয়ন (১ মিলিয়ন = ১০ লক্ষ, ১০০০ মিলিয়ন = ১ বিলিয়ন = ১০০ কোটি) হলে সেই AI-কে একটা পকেট ডিক্সেনারি মার্কা কিছু ভাবা যেতে পারে। সে সাধারণ গ্রামার বুঝবে, সাধারণ কিছু বিষয় বুঝবে, এটা ওটার মধ্যে তফাৎ করতে পারবে, টেক্সট লেখার সময় অটোকমপ্লিট করতে পারবে। আরেকটু বড়ো নেটওয়ার্ক যেখানে প্যারামিটারের সংখ্যা 7 বিলিয়ন – 13 বিলিয়ন-এর মতো, তাকে আমরা একজন স্মার্ট হাইস্কুল স্টুডেন্ট ভাবতে পারি। সে আমাদের ভাষা বুঝে দারুণভাবে ইনস্ট্রাকশান ফলো করতে পারবে, কিছু পড়ে বিষয়ের সারমর্ম বুঝতে পারবে, বেসিক কোডিং করে ফেলবে। এবার নেটওয়ার্ক আরেকটু বড় হলো। প্যারামিটারের সংখ্যা বেড়ে হলো 70 বিলিয়ন – 175 বিলিয়ন। এর ক্ষমতা বিশ্ববিদ্যালয়ের একজন অভিজ্ঞ অধ্যাপকের মতো ভাবা যেতে পারে। জটিল সব যুক্তি-বিচার, বিভিন্ন সম্পর্ক বোঝা, বিভিন্ন বিষয়ের সূক্ষ্ম তারতম্য করা, একটা কঠিন প্রবলেমকে বিভিন্ন স্টেপে ভেঙে সমাধান করা – এসব কাজ সে অনায়াসে করে ফেলবে। আর যদি, প্যারামিটারের সংখ্যা 1 ট্রিলিয়ন ( = ১০০০ বিলিয়ন) ছাড়িয়ে যায় তবে তার ক্ষমতা ম্যাজিকের মত বেড়ে যাবে। যেন একটা মস্ত লাইব্রেরি জীবন্ত হয়ে আমাদের জন্য নানান করতে প্রস্তুত! উঁচু পর্যায়ের লজিক, বিভিন্ন বিষয়ের পারদর্শিতা ও তাদের মধ্যে সংযোগ স্থাপন, নানান কিছু সৃষ্টিশীল কাজ, যেমন ছবি তৈরি, গল্প কবিতা উপন্যাস লেখা, রিসার্চ-এর থিসিস লেখা এরকম কতকিছুই যে করতে পারবে তার কোন ইয়ত্তা নেই।

 

এখন কথা হলো, আমরা AI-কে বুঝতে চাইছি। তিনমাত্রা থেকে অসংখ্য মাত্রার স্পেসে কাল্পনিক স্পেস ট্রাভেল করে পৌঁছানোর চেষ্টা করতে চাইছি, দেখতে চাইছি তার কর্মকান্ড-এর বিষয়। কিন্তু, সে তো মোটেই সহজ কাজ নয়। আমাদের মস্তিষ্ক তার জন্য তৈরি নয়। তবে, AI ইঞ্জিনিয়াররা বোঝার জন্য একটা যান্ত্রিক ব্যাখ্যা (mechanistic interpretation) পাবার চেষ্টা করেন। বাক্স খুলে দেখার চেষ্টা করেন সেখানে কী ঘটছে। একেবারে নিউরোবায়োলজিস্টদের মতো। তারা আমাদের ব্রেইনের সাথে নানান ইলেকট্রোড যুক্ত করে তারপর ব্রেইন স্ক্যান করে বুঝতে চান, কোন আবেগ বা কোন আদর্শ বা কোন উত্তেজনার ক্ষেত্রে ব্রেইনের কোন কোন অংশের নিউরনগুলো ফায়ার করে, কিভাবে পরষ্পর যুক্ত হয় সেগুলো ইত্যাদি। AI-এর ক্ষেত্রে তার ব্রেইন-কে এরকম বুঝতে চাওয়াটা হলো একধরণের রিভার্স ইঞ্জিনিয়ারিং! আমরা AI-এর ভিতরকার ব্লুপ্রিন্ট-কে বুঝতে চাইছি। AI-কে যখন কোন প্রম্পট দিই তখন তার ভিতরে বিলিয়ন প্যারামিটারের মিলিত অঙ্ক-এর কর্মকান্ড থেকে আমাদের বোঝার মতো একটা ফ্লো-চার্ট তৈরি করা যায় কিনা সেই চেষ্টাই করা হচ্ছে এখন।

 

(চলবে)

Leave a Reply

Your email address will not be published. Required fields are marked *

2 × two =