AI এসে গেছে (পর্ব ৩)

অভিজিৎ কর গুপ্ত

পদার্থ বিজ্ঞানের অধ্যাপক, পাঁশকুড়া বনমালী কলেজ (অটোনমাস)

Posted on ৩ মে, ২০২৬

কোন কিছু জানা মানে হচ্ছে সেই জিনিসটাকে মনে রাখা। কোন কিছু বোঝা মানে হলো, বিষয়টাকে মাথার মধ্যে খেলাতে পারা, তার সাথে আমাদের অভিজ্ঞতাকে যুক্ত করা, মনে মনে বুঝে নেওয়া এরকম হলে কী হবে, ওরকম হলে কী পরিবর্তন হবে ইত্যাদি। আমাদের বাস্তব অভিজ্ঞতার জগৎ ত্রিমাত্রিক। এর বেশি মাত্রার কিছু আমরা ধারণা করতে পারি না। কিন্তু, AI তার হিসাবনিকাশ করে বহুমাত্রিক স্পেসে। হাজার হাজার ডাইমেনশান। একটা ছবি বা লেখা বা অডিও বা যা কিছু ইনপুট দেওয়া হোক তাকে বিভিন্ন ফিচার-এর বহুমাত্রিক স্পেসে ফেলে সে কম্পিউটেশান করে। একটা ব্যাপার কল্পনা করে নিতে পারি, একটা হাজার হাজার ডাইমেনশানের স্পেস, বিশাল বিস্তৃত এক আয়তনের ব্যাপার যেখানে দুনিয়ার চেনাজানা নাম বা বস্তুগুলো খুব অল্প জায়গা নিয়ে একেকটা ছোট্ট ছোট্ট ক্লাসটারে অবস্থান করছে আর বেশিরভাগ জায়গাই ফাঁকা। ঠিক যেন আমাদের এই মহাজগতের মতো। এই বহুমাত্রিক ফাঁকা স্পেসে যেন এ. আই. বিচরন করছে, আর ফাঁকা জায়গার কোথাও গিয়ে হয়ত সে পৌঁছাচ্ছে কখনো, সম্ভাব্যতার পথ ধরে। মনে রাখতে হবে, AI সত্য (Truth) অনুসন্ধান করে না, সম্ভাব্যতা (Probability) অনুযায়ী একটা জায়গায় গিয়ে পৌঁছায়। বহুমাত্রার জগতে হয়ত কখনো কোথাও গিয়ে সে থামছে আর নতুন কিছু খুঁজে বার করছে যা আমাদের ত্রিমাত্রিক ভাবনাতে ধরা পড়ছে না। বহুমাত্রিক স্পেসে বিষয়গুলো অনেক দূরে দূরে, তারা হয়ত আলাদা হয়ে যাচ্ছে, কাজেই তফাৎ করা যাচ্ছে, অন্যভাবে চেনা যাচ্ছে তাদের, তাদের ভিতরকার অচেনা সম্পর্ক। এই যে বহুমাত্রার স্পেসে একটা কিছু সমাধানের বা সৃষ্টির উদ্দেশ্যে সম্ভাব্য পথ খুঁজে কোথাও পৌঁছতে চাওয়া তা আমাদের কল্পনাতে ধরা দেবে কী করে? অসম্ভব একটা ব্যাপার! এখানেই কীভাবে AI তার এই নিজস্ব বহুমাত্রিক জগতে ‘চিন্তা’ করছে তা বোঝার জন্য একটা গ্যাপ থেকে যাচ্ছে।

মানুষের মস্তিষ্ক হলো গল্প বলার মেশিন। আমাদের বোঝাপড়ার ক্ষেত্রে একটা গল্পের দরকার হয়। কোন কারণ আর তার পরিণাম (cause and effect)-কে যুক্ত করে আমরা বুঝে নিতে চাই কোন বিষয়কে। যেমন ধরা যাক, আগুন বললেই আমাদের মস্তিষ্কে উত্তাপ বা পুড়ে যাওয়ার একটা ছবি ভেসে ওঠে। আমরা বস্তুজগতের সাথে সম্পর্ক স্থাপন করি। আগুনের রাসায়নিক ফর্মূলা নিয়ে ভাবনা আসে পরে। আর, AI-এর কাছে কোন বিষয় স্বভাবতই আখ্যানহীন (no narrative)! AI যখন কোন বিষয় বুঝে সিদ্ধান্ত নেয় বা কোন কিছু সৃষ্টি করে তা সে করে নানারকম অঙ্ক আর এলগোরিদমের মাধ্যমে। এর সাথে কোন আখ্যান যুক্ত থাকে না। একেবারে আমাদের উলটো। তবে যে সিদ্ধান্তে সে পৌঁছাচ্ছে, বা যেসব সৃষ্টিশীল কাজ সে করছে, তা থেকে তো বোঝার উপায় থাকে না সেসব মানুষ না মেশিন কে করেছে।

কোন কিছু বুঝতে পারলে আমাদের একটা সজ্ঞান তৃপ্তি হয়। নতুন কোন ইনফরমেশন এলে তাকে যদি আমরা আমাদের বিশ্বাসের প্রেক্ষাপটে স্থান দিতে পারি তাহলে আমরা ভাবি, আহা! এই তো বুঝেছি! তা না হলে যেন একটা মানসিক সংঘাত চলতে থাকে। যেভাবেই হোক, একটা নতুন ভাবনাকে হয় তার আকার আকৃতির পরিবর্তন করে আমাদের বিশ্বাসের বা অভিজ্ঞতার ক্যানভাসে স্থান দেওয়া অথবা আমাদের অভিজ্ঞতার ক্যানভাসটাকে একটু বিস্তৃত করে তাকে স্থাপন করা – এই হলো আমাদের বোঝার ব্যাপার। দার্শনিকরা হয়ত বলবেন, understanding বা বোঝার ব্যাপারটা স্থির বা অচল কোন বিষয় নয়। Understanding কোন সত্যকে ধরতে যাওয়ার ব্যাপার না। তা হলো একটা relationship! আমাদের জাগতিক অভিজ্ঞতার সাথে সম্পর্ক স্থাপন করা। AI-এর ক্ষেত্রে অবশ্যই এসব কোন ব্যাপার নেই। তাহলে AI কি understand করে না, নাকি অন্যভাবে করে? অথবা প্রশ্ন করতে পারি, understanding-এর কি একটাই পথ, ঠিক আমরা যেভাবে বুঝি? অন্য কোনভাবে সম্ভব নয়?

আসলে, আমাদের সংস্কৃতিতে এইরকম একটা বৈপ্লবিক সময়ে আমরা দেখছি AI-এর নানান কর্মকান্ড ক্রমাগত আমাদেরকে একেকটা চ্যালেঞ্জের মুখোমুখি দাঁড় করিয়ে দিচ্ছে। আমাদের সভ্যতার সুদীর্ঘ ইতিহাসে, আমাদের সমস্ত প্রাথমিক ধারণাগুলোকে নিয়ে নতুন করে ভাবার যেন সময় এসেছে। Understanding কী, meaning কী, thinking কী? জ্ঞান ও সৃষ্টির ক্ষেত্রে এরকম অনেককিছুর ভিত্তি নিয়ে আমাদের হয়ত নতুন করে অনুসন্ধান চালানো দরকার। যদি বলা হয়, understanding মানে শুধু সবকিছু খুঁটিনাটি জানা নয়, খেলার নিয়মটা (rule of the game) কী সেটা বুঝতে পারলেই হলো, তাহলে হয়ত AI বহুমাত্রার স্পেসে কীভাবে একেকটা রাস্তা খুঁজে কোথাও পৌঁছাচ্ছে তার খানিকটা আমরা ধারণাতে আনতে পারি।

আসলে, আমরা বুঝতে চাইছি AI তথা একটা কৃত্রিম নিউরাল নেটওয়ার্ক ঠিক কীভাবে কাজটা করছে। অত্যন্ত জটিল একটা সিস্টেম (Complex system), তার ভিতরে কী হচ্ছে তা ধরে ধরে বোঝা খুব কঠিন। কাজেই তা যেন আমাদের কাছে একটা ব্ল্যাক বক্স! অথচ একটা কৃত্রিম নিউরন খুব সহজ একটা কনসেপ্ট। কিছু ইনপুট ইনফরমেশান, হতে পারে কোন গল্প, কবিতা, আবেগ, সেন্টিমেন্ট অথবা কিছু সিম্বল বা অঙ্ক, বা ছবি, অডিও, ভিডিও ইত্যাদি। যা কিছুই হোক এসব কম্পিউটারের কাছে সংখ্যার একেকটি সংগ্রহ ছাড়া আর কিছুই নয়। এইসব সংগ্রহকে বিভিন্ন স্তরে সাজিয়ে বোঝার চেষ্টা আর তা দিয়ে অঙ্ক করা। একমাত্রিক অর্থাৎ এক লাইনে সাজিয়ে রাখলে আমরা বলি ভেক্টর। একটা এক্সেল শীট-এর মতো রো আর কলাম হিসাবে সাজিয়ে পরিবেশন করলে তা হলো দ্বিমাত্রিক যাকে আমরা মেট্রিক্স বলি। আবার একটা রঙিন ছবি হলো ত্রিমাত্রিক, কেননা তা তিনরকম রঙের (লাল, সবুজ, নীল) পিক্সেল দিয়ে তৈরি করা তিনটে মেট্রিক্স-এর সংমিশ্রণ। আবার একটা ভিডিও হবে চারমাত্রিক ইত্যাদি। যাই হোক, একটা নিউরনের নানান ইনপুট চ্যানেল দিয়ে এরকম সংখ্যাগুলো ঢুকছে, এরপর নিউরন এক একটা গুণক দিয়ে গুণ করে নিচ্ছে, তারপর সব যোগ করে তার সাথে নিজস্ব বায়াস যোগ করছে। এইসব প্রভাবশালী গুণকগুলো এবং বায়াস – এদের একসাথে গুণক (weights)-ই বলা যাক। এই অবধি ব্যাপারটা লিনিয়ার বা রৈখিক। সরলরেখার ফর্মূলাতে ফেলে দেখা যায় কী চলছে: y = w.x + b, এখানে w, b এরাই হলো সেইসব গুণক, আর x যদি ইনপুট হয়, y হলো আউটপুট। কিন্তু, এরপর দেখতে হবে প্রতিটা নিউরনের সিদ্ধান্ত নেওয়ার ক্ষমতা – সে ফায়ার করবে কী করবে না, উজ্জীবিত হয়ে তার সঙ্গে যুক্ত অন্য নিউরনদের মধ্যে ইনফরমেশন শেয়ার করবে কিনা। আসলে, এভাবেই ঢুকে পড়ছে ননলিনিয়ারিটি। অসংখ্য ননলিনিয়ার এলিমেন্ট পরষ্পর যুক্ত হয়ে শেষে একটা অসম্ভব জটিল সিস্টেম (Complex system) তৈরি হচ্ছে আর তা একসময় আমাদের বোধগম্যতার সীমা ছাড়িয়ে যাচ্ছে। এখানেই শেষ নয়। এই কৃত্রিম নিউরাল নেটওয়ার্ক বা কৃত্রিম মস্তিষ্ক কীভাবে সব শিখতে শুরু করে তাও একটু বোঝা দরকার। নানা ধরণের ইনফরমেশান (নানানরকমের তথ্য) ইনপুটে দিয়ে তারপর আউটপুট চেক করা হয়, কখনো তথ্যকে চিনিয়ে দেওয়া হয় লেবেল দিয়ে, কখনো নেটওয়ার্কই আবিষ্কার করে নেয় তথ্যের মধ্যে লুকিয়ে থাকা কোন প্যাটার্ন। প্রচন্ড পরিমাণে ট্রেনিং করা হয় একেকটি বিশাল নেটওয়ার্ক-কে, যা অসম্ভব খরচা সাপেক্ষও বটে। এরপর কতটা ভুল হচ্ছে দেখা হয়। ভুল বা লস-এর হিসাব রাখা হয়। কিভাবে নেটওয়ার্ক-এর গুণকগুলোকে একটু একটু করে কমিয়ে বাড়িয়ে নিয়ন্ত্রণ করলে আউটপুটে ভুলের পরিমাণ কমিয়ে আনা যায় এসব দেখা হয়। ব্যাপারটা মোটেই সহজ কাজ নয়। তবে, এ নিয়ে অনেক ইঞ্জিনিয়ারিং, অনেক গবেষণা অনবরত চলতে থাকে।

এখনকার একেকটি বড় বড় AI (যেমন chatGPT, Gemini, Copilot, Claude, Deepseek…)-এর কৃত্রিম নিউরাল নেটওয়ার্কে যত নিউরন থাকে, যতগুলো নিউরনের স্তর বা লেয়ার থাকে এবং তারা একে অপরের সাথে যেভাবে সংযুক্ত থাকে সেসব থেকে হিসাব করলে মোটামুটি একটা আন্দাজ করা যাবে কত গুণক থাকতে পারে। অবশ্য, নেটওয়ার্ক-এর নানারকম আর্কিটেকচার হয়। সবাই সবার সাথে সংযুক্ত থাকলে তা একরকম ব্যাপার (fully connected network), তারপর কোন স্তরে কতগুলো নিউরন থাকবে, কার সাথে কার কানেকশান থাকবে, কিভাবে স্তরগুলো বিন্যস্ত হবে এসব নানান হিসাব আছে। তবে, এখনকার দিনে আধুনিক বড় মাপের AI গুলো সব বহুমুখী (multimodal)! অনেকরকম আর্কিটেকচার, অনেক ধরণের এলগোরিদম, অনেক মডেলের সংমিশ্রণ থাকে। আর আছে নানান ইঞ্জিনিয়ারিং টেকনিক, অঙ্কের হিসাবনিকাশ। ভাবা যেতে পারে, নানান স্পেশ্যালিস্ট বা নানাধরণের বিশেষজ্ঞদের একটা টীম যাদের মধ্যে কাজ ভাগ হয়ে যাচ্ছে, তারপর তাদের মধ্যে সমন্বয় সাধন করা হচ্ছে আর আমরা শেষে কিছু সমাধান বা সৃষ্টি দেখতে পাচ্ছি। এসব নিয়ে এখন লিখছি না, পরে আলোচনা করা যাবে। শুধু গুণকগুলো কত সংখ্যায় থাকতে পারে তার একটা আইডিয়া দেওয়া যাক। তবে অবশ্য, কোন AI কোম্পানি ( OpenAI, Google, Anthropic, Microsoft…) তাদের নিউরাল নেটওয়ার্কের বিষয়ে বিস্তারিত হিসাব কখনো প্রকাশ করে না। এগুলো সব সিক্রেট! এখানে একটা বেশ কোল্ড ওয়ার-এর মতো ব্যাপার চলে!

একটা কথা মাথায় রাখতে হবে, এই কৃত্রিম নেটওয়ার্কই হলো ব্রেইন বা মস্তিষ্ক! এখানেই সবকিছু ঘটছে। একটা ব্যাপার দেখা যাচ্ছে, ব্রেইন যত বড় হচ্ছে, মানে নেটওয়ার্কের সাইজ বা গুণকের সংখ্যা যত বেশি হচ্ছে ততই AI-এর পারদর্শিতা আর কাজের নতুন নতুন দিক খুলে যাচ্ছে। এটাকে এক কথায় স্কেলিং বলা হয়। বড়ো, আরো বড়ো, আরো আরো বড়। এসবের জন্য বিশাল আয়তনের ডাটা সেন্টার তৈরি করতে হয় যেখানে বিশেষভাবে ডিজাইন করা অসংখ্য Graphics Processor Unit (GPU) ওলা সারি সারি কম্পিউটার বসাতে হয়। এইসব কর্মকান্ডের জন্য যে বিশাল পরিমাণ পাওয়ার সাপ্লাই দরকার হয় তা সত্যিই অকল্পনীয়! অনেক গিগাওয়াট পাওয়ার লাগে যা একটা ছোটখাটো শহরের ইলেক্ট্রিসিটির চাহিদার সমান। অন্যদিকে আমাদের মস্তিষ্ক মাত্র ২০ ওয়াট পাওয়ার নিয়েই কত কিছু কাজ করে ফেলছে! তবে, আমরা কী পারি আর কী পারি না, মেশিন কী পারে আর কী পারে না এই ব্যাপারগুলো মাথায় রাখতে হবে।

মোটামুটি একটা ধারণা দেওয়া যাক। কোন AI-এর নিউরাল নেটওয়ার্কের গুণক বা প্যারামিটারগুলোর সংখ্যা 125 মিলিয়ন – 1 বিলিয়ন (১ মিলিয়ন = ১০ লক্ষ, ১০০০ মিলিয়ন = ১ বিলিয়ন = ১০০ কোটি) হলে সেই AI-কে একটা পকেট ডিক্সেনারি মার্কা কিছু ভাবা যেতে পারে। সে সাধারণ গ্রামার বুঝবে, সাধারণ কিছু বিষয় বুঝবে, এটা ওটার মধ্যে তফাৎ করতে পারবে, টেক্সট লেখার সময় অটোকমপ্লিট করতে পারবে। আরেকটু বড়ো নেটওয়ার্ক যেখানে প্যারামিটারের সংখ্যা 7 বিলিয়ন – 13 বিলিয়ন-এর মতো, তাকে আমরা একজন স্মার্ট হাইস্কুল স্টুডেন্ট ভাবতে পারি। সে আমাদের ভাষা বুঝে দারুণভাবে ইনস্ট্রাকশান ফলো করতে পারবে, কিছু পড়ে বিষয়ের সারমর্ম বুঝতে পারবে, বেসিক কোডিং করে ফেলবে। এবার নেটওয়ার্ক আরেকটু বড় হলো। প্যারামিটারের সংখ্যা বেড়ে হলো 70 বিলিয়ন – 175 বিলিয়ন। এর ক্ষমতা বিশ্ববিদ্যালয়ের একজন অভিজ্ঞ অধ্যাপকের মতো ভাবা যেতে পারে। জটিল সব যুক্তি-বিচার, বিভিন্ন সম্পর্ক বোঝা, বিভিন্ন বিষয়ের সূক্ষ্ম তারতম্য করা, একটা কঠিন প্রবলেমকে বিভিন্ন স্টেপে ভেঙে সমাধান করা – এসব কাজ সে অনায়াসে করে ফেলবে। আর যদি, প্যারামিটারের সংখ্যা 1 ট্রিলিয়ন ( = ১০০০ বিলিয়ন) ছাড়িয়ে যায় তবে তার ক্ষমতা ম্যাজিকের মত বেড়ে যাবে। যেন একটা মস্ত লাইব্রেরি জীবন্ত হয়ে আমাদের জন্য নানান করতে প্রস্তুত! উঁচু পর্যায়ের লজিক, বিভিন্ন বিষয়ের পারদর্শিতা ও তাদের মধ্যে সংযোগ স্থাপন, নানান কিছু সৃষ্টিশীল কাজ, যেমন ছবি তৈরি, গল্প কবিতা উপন্যাস লেখা, রিসার্চ-এর থিসিস লেখা এরকম কতকিছুই যে করতে পারবে তার কোন ইয়ত্তা নেই।

এখন কথা হলো, আমরা AI-কে বুঝতে চাইছি। তিনমাত্রা থেকে অসংখ্য মাত্রার স্পেসে কাল্পনিক স্পেস ট্রাভেল করে পৌঁছানোর চেষ্টা করতে চাইছি, দেখতে চাইছি তার কর্মকান্ড-এর বিষয়। কিন্তু, সে তো মোটেই সহজ কাজ নয়। আমাদের মস্তিষ্ক তার জন্য তৈরি নয়। তবে, AI ইঞ্জিনিয়াররা বোঝার জন্য একটা যান্ত্রিক ব্যাখ্যা (mechanistic interpretation) পাবার চেষ্টা করেন। বাক্স খুলে দেখার চেষ্টা করেন সেখানে কী ঘটছে। একেবারে নিউরোবায়োলজিস্টদের মতো। তারা আমাদের ব্রেইনের সাথে নানান ইলেকট্রোড যুক্ত করে তারপর ব্রেইন স্ক্যান করে বুঝতে চান, কোন আবেগ বা কোন আদর্শ বা কোন উত্তেজনার ক্ষেত্রে ব্রেইনের কোন কোন অংশের নিউরনগুলো ফায়ার করে, কিভাবে পরষ্পর যুক্ত হয় সেগুলো ইত্যাদি। AI-এর ক্ষেত্রে তার ব্রেইন-কে এরকম বুঝতে চাওয়াটা হলো একধরণের রিভার্স ইঞ্জিনিয়ারিং! আমরা AI-এর ভিতরকার ব্লুপ্রিন্ট-কে বুঝতে চাইছি। AI-কে যখন কোন প্রম্পট দিই তখন তার ভিতরে বিলিয়ন প্যারামিটারের মিলিত অঙ্ক-এর কর্মকান্ড থেকে আমাদের বোঝার মতো একটা ফ্লো-চার্ট তৈরি করা যায় কিনা সেই চেষ্টাই করা হচ্ছে এখন।

(চলবে)

AI এসে গেছে (পর্ব ৩)

AI এসে গেছে (পর্ব ৩)

এই নিবন্ধটি ছড়িয়ে দিন

Leave a Reply Cancel reply