AI এসে গেছে (পর্ব ৪)

AI এসে গেছে (পর্ব ৪)

অভিজিৎ কর গুপ্ত
পদার্থ বিজ্ঞানের অধ্যাপক, পাঁশকুড়া বনমালী কলেজ (অটোনমাস)
Posted on ১০ মে, ২০২৬

“Attention is all you need!” এটা আধুনিক AI-এর জগতে একটা যুগান্তকারী গবেষণা পত্রের শিরোনাম (মূলত: গুগুলের এ আই গবেষকদের অবদান, ২০১৭) । এ যেন শুধু এক এলগোরিদম নয়, আধুনিক জেনারেটিভ AI-এর অসম্ভব কান্ডকারখানার নেপথ্যে থাকা এক রহস্যময় মন্ত্র (secret sauce)! chatGPT, Gemini, Claude, Copilot, Deepseek-এর মতো বড় AI অ্যাপগুলো, বা এজেন্টিক AI – এরা একরকম attention mechanism অথবা বাংলা করে বললে মনোযোগের কায়দার উপর নির্ভরশীল। নিউরাল নেটওয়ার্ক-এর এক বিশেষ আর্কিটেকচার, যার নাম ট্রান্সফর্মার (Transformer) আর তার সাথে আছে এই মনোযোগ নির্ভর LLM (Large Language Model)।

 

মানুষের ভাষা (Natural language) বুঝে ফেলছে মেশিন। মানুষের চাহিদা আর মনের কথা বুঝে নিয়ে অনায়াসে সব উত্তর দিচ্ছে AI, পর্যাপ্ত ট্রেনিং হওয়ার পর প্যাটার্ন বুঝে অভূতপূর্ব সব সিদ্ধান্ত নিচ্ছে, আর অনবদ্য সব সৃষ্টি করে চলেছে সে।

 

Self attention! আসলে, খুবই স্বাভাবিক একটা ভাবনা। আমরা যখন ভাষার ব্যবহার করে কোন কিছু প্রকাশ করি, তা সে গল্প কাহিনি, ইতিহাস বিজ্ঞান বা যাকিছুই হোক না কেন, একটা টেক্সট বা কোন লেখা অথবা কোন স্ক্রিপ্ট বা কোড, সবকিছুর ভিতরেই এক একটা শব্দ বা শব্দাংশ বা সিম্বল অন্যদের সাথে কীভাবে সম্পর্কিত তা দেখতে হয়, তা সে তার ভিতর যেখানেই অবস্থান করুক, তাদের মধ্যের কানেকশান টা গুরুত্বপূর্ণ। আমরা নিজেরা সেসব বুঝি, কিন্তু, মেশিন বুঝবে কী করে? এর পিছনের অঙ্ক আর এলগোরিদম-এর নিয়মকানুনই হলো LLM! যেমন ধরা যাক, যদি বলা হয়, ‘তুমি পরীক্ষায় রসগোল্লা পাবে।’। এখন এই রসগোল্লা যে সত্যিকারের রসগোল্লা নয়, বরং পরীক্ষার সাথে যুক্ত কিছু ব্যাপার, এই জায়গাটাতেই মনযোগ দিতে হবে, কানেকশান বা সম্পর্ক খুঁজতে হবে। একটা লেখার সমস্ত অংশগুলো-কে (দাঁড়ি কমা সবকিছু সহ) একেকটি ইউনিট বা টোকেন হিসাবে নাম্বারিং করে তারপর তাদেরকে এক একটা ভেক্টরে পরিণত করা হয় (একে বলে এম্বেডিং)।

 

ভেক্টর মানে হলো অনেক সংখ্যার একটা একমাত্রিক সংগ্রহ। যেমন, যদি বলা হয়, (2, 3, 4) একটা ভেক্টর। এভাবে ভাবতে পারা যায়, এর মানে, এখান থেকে ডানদিকে 2 ঘর যাও, তারপর লম্ব বরাবর সামনের দিকে 3 ঘর যাও, তারপর উপরের দিকে 4 ঘর যাও। এই ভেক্টর তিনমাত্রার মধ্যে অবস্থান করছে। সুতরাং আমরা সহজেই বুঝে নিতে পারি। কিন্তু, যদি একেকটা ভেক্টর থাকে 1000 বা 10,000 মাত্রার স্পেসে (ভেক্টরগুলোতে অতগুলোই সংখ্যা বা অংশ আছে ভাবতে হবে), তাহলে? আসলে এই টোকেনগুলোর জন্য বানানো বিরাট সাইজের ভেক্টরগুলো একটা বিশাল মাত্রার ভেক্টর স্পেসে কোথাও অবস্থান করবে। তাদের অবস্থান, নিজেদের মধ্যে দূরত্ব, তাদের মধ্যের কৌনিক মাপ ইত্যাদি অঙ্ক আর জ্যামিতি হিসাব করে কে কার সাথে কিভাবে জুড়ে অর্থ তৈরি করছে এই নিয়ে লিনিয়ার এলজ্যাবরা (Linear Algebra)-র অঙ্ক করা হয়। মেশিন একটা টেক্সট পড়ে ভেক্টরগুলোর মধ্যে গাণিতিক সম্পর্ক থেকে বুঝে নেয় টোকেনগুলো কার সাথে কীভাবে যুক্ত হয়ে অর্থবহ হয়ে উঠছে। আর উত্তর দেবার সময় কোন টোকেন আসবে তার সম্ভাব্যতা হিসাব করে একেক করে বলতে থাকে। আমরা ভাবি মেশিন কী সুন্দর আমাদের মতো চিন্তা করে সব বুঝে যাচ্ছে আর বলছে। তবে, তার নাগাল আমরা বুঝতে পারি না সহজে। একটা ধারণা করতে পারি মাত্র। এই যেমন ধরা যাক, King – Man + Woman = Queen! এটা একটা সরল অঙ্ক। আসলে এটাই দেখার যে, প্রম্পট-এ দেওয়া এই শব্দগুলোর ভিতরে AI কীভাবে কানেকশান তৈরি করে একটা সুযোগ্য উত্তর তৈরি বের করে আনছে। এর আড়ালে আসল অঙ্ক যা আছে তা এখন থাক। কিন্তু, এই শব্দগুলো যদি একেকটা টোকেন হয় তবে তাদের মধ্যে এই অঙ্কের সম্পর্ক থেকে অর্থ-টা সহজেই আমরা অনুমান করতে পারি। ছবি দিয়েও এসব সরল অঙ্ক করা যায়। বেশ মজার একটা ব্যাপার! এই যেমন Gemini AI সেদিন ভ্যান গখ-এর বিখ্যাত ছবি Starry Night থেকে Paint বিয়োগ করে তার সাথে Physics যোগ করে দেখালো কেমন Fluid Dynamics-এর একটা ছবি হয়ে উঠছে সেটা।

 

তবে, আমরা মানুষেরা যেভাবে ভাবি, তা হল মূলত সিরিয়াল থিংকিং অর্থাৎ পরপর ঘটনাগুলোর ভিতর সংযোগ স্থাপন করতে করতে যাই আমরা। একেকটা ন্যারেটিভ তৈরি হয় মনের ভিতর। AI-এর ক্ষেত্রে এসব ন্যারেটিভের ব্যাপার নেই, কেননা আমাদের মতো তার কোন অনুভব নেই। কৃত্রিম নিউরনদের কোটি কোটি সংযোগ-কে সমান্তরাল ভাবে প্রসেস করে সে চটজলদি উত্তর দেয়। কিন্তু, উত্তর যা দিচ্ছে তা তো জেনুইন – একেবারে সত্যি! আমাদের সঙ্গে মনের মতো গল্প করছে, আমাদের ভাবনা-কে চালিত করছে। যদি ভাবি, AI-এর তো আমাদের মতো কোন ‘মন’ নেই, তাহলে এইসব ভাবনা যা ভাবছে আর আমাদের ভাবাচ্ছে তার জন্য সে কীভাবে ভেবে বলছে। তার ভাবনাটাকে ফেক বলা যাবে না, তা আদ্যন্তই জেনুইন। উত্তরে পৌঁছানোর জন্য তার নির্দিষ্ট পথ আছে। একে আর্টিফিসিয়াল ইন্টেলিজেন্স না বলে বরং হয়ত সিন্থেটিক ইন্টেলিজেন্স বলা যেতে পারে। সেই অর্থে কৃত্রিম নয় আবার মানুষের মতো এর ফিলিং বা অনুভবও নেই।

 

যদি তর্ক করা যায়, একজন মানুষও যখন কথা বলছেন তখন তার মানের ভিতরে কী হচ্ছে, তার মগজে তিনি কীভাবে কম্পিউট করছেন, সেসব ইন্টারনাল প্রসেস নিয়ে কি আমরা বোঝার চেষ্টা করতে থাকি নাকি আমরা তার সঙ্গে অর্থবহ আলোচনা উপভোগ করি? যেকোন AI-এর সাথে তো আমরা ঘণ্টার পর ঘণ্টা ভীষণ বুদ্ধিদীপ্ত, সফিস্টিকেটেড আলোচনা চালিয়ে যেতে পারি।

 

আসলে, আমাদের বায়োলজিক্যাল ভাবনা প্রভাবিত হয় হোমিওস্ট্যাসিস-এর আইডিয়া দিয়ে। আমাদের ভাবনাগুলো জাগতিক। জগতের সাথে আমরা সংযোগ স্থাপন করি আমাদের বেঁচে থাকার তাগিদে। আমাদের ক্ষুধা, আমাদের ভয়, আমাদের ভালোবাসা, আকর্ষণ, উত্তেজনা অথবা আমাদের পরিশ্রান্ত হয়ে পড়া এসবই আমাদের চিন্তাকে প্রভাবিত করে। আমাদের ভাবনা তাই কখনো এলোমেলো, আবেগতাড়িত। আমরা তার প্রকাশ ঘটাই। কিন্তু, AI-এর ক্ষেত্রে এসব ব্যাপার নেই। সবকিছুই একটা লক্ষ্য নিয়ে করা (goal oriented), একটা অবজেক্টিভ নির্ভর। বায়োলজিকালি ফিলিং-এর বদলে গাণিতিক লস ফাংশান (loss function) এখানে তাকে নির্দিষ্ট লক্ষ্যে চালিত করে। আমরা একে স্বভাবতই ‘ভাবনা’ বলি না, একটা প্রসেস মাত্র। কিন্তু, এটাও তো ঠিক, আমাদের ভাবনার প্রসেস যদি একটা রাস্তা হয় তাহলে AI-এর ভিতরকার প্রসেসও আরেকটা রাস্তা! কৃত্রিম নিউরাল নেটওয়ার্ক-কে যদি আমরা একটা ব্রেইন ভাবি, তাহলে সেই ব্রেইন বা মস্তিষ্কের মধ্যে যে প্রসেস চলে, তা থেকে অসম্ভব কিছু ভাবনার প্রকাশ তো আমরা দেখতেই পাচ্ছি বিজ্ঞান-সাহিত্য-শিল্প-দর্শন-এ। যেসব তথ্য-কে আমরা নয়েজ ভেবেছি, ফেলে দেওয়ার মতো ভেবেছি, তার ভিতর থেকে লক্ষ লক্ষ প্রোটিন স্ট্রাকচার বুঝে নেওয়া আর ড্রাগ ডিজাইন করা, এ তো এক অভূতপূর্ব ভাবনারই প্রকাশ!

 

আসলে, ড্রাগ ডিজাইন বা এয়ারোডাইনামিকস-এর নতুন নতুন ভাবনা থেকে শুরু করে অঙ্কের দীর্ঘকলের অমীমাংসিত প্রবলেম-এর সমাধান করা, শিল্প-সাহিত্য সৃষ্টি করা ইত্যাদি যা কিছু অসাধ্য সাধন AI করছে তাকে আমরা ফাংশনালিটির দিক থেকেই দেখছি। মানুষের মতো তার কষ্ট (suffering), আর সংগ্রামের দিকটা নেই বলে মনে করছি। অবশ্য, আমাদের সমাজে বিজ্ঞান, অঙ্ক বা ইঞ্জিনিয়ারিং-এর ক্ষেত্রেও এরকমটা হয়, স্রষ্টার কষ্ট বা স্ট্রাগল চোখে পড়ে না। আমরা ফাংশানালিটিতেই আটকে পড়ি। কিন্তু, শিল্প সৃষ্টি বা ক্রাফট তৈরির ক্ষেত্রে আমরা মানুষের কষ্ট, প্রসেস-এর অপ্রতুলতা সরাসরি দেখতে পাই। তাই আমাদের কাছে এর গুরুত্ব, এর পিছনের ভাবনা ও শ্রমের প্রতি আমাদের দরদ অনুভূত হয়। সেজন্য একটা প্রিন্ট করা চিঠির চাইতে হাতে লেখা চিঠিকে আমরা বেশি মূল্য দিই কারণ সেখানে লেখকের শ্রম ও প্রচেষ্টা, তার কিছু আত্মবলিদানের একটা ছাপ যেন থেকে যায় এতে।

 

অবশ্যই AI আমাদের মতো নয়। সে আমাদের মতো বিবর্তনের প্রক্রিয়ার মধ্যে দিয়ে আসে নি। অর্থনীতির দিক থেকে যে ভাবনাটা অপ্রতুল তাকেই আমরা বেশি গুরুত্ব দিই। AI প্রতি মুহুর্তে কোটি কোটি ভালো ভাবনা জেনারেট করে চলেছে। কাজেই এত ভাবনার প্রাচুর্যের মধ্যে সেসবের মূল্য শূন্যের কাছাকাছি চলে যেতেই পারে!

 

তাহলে, এই AI-এর যুগে ভাবনার এই প্রাচুর্য-এর সামনে দাঁড়িয়ে আমাদের ভূমিকা কী হবে? নতুন নতুন ভাবনা সৃষ্টির ভূমিকা যদি আমাদের কাছ থেকে AI-এর আয়ত্তে চলে যায় তাহলে আমরা কী করব? আমরা হয়ত স্রষ্টার ভূমিকা ছেড়ে, তত্ত্বাবধান (curation) আর বৈধতা যাচাই (validation)-এর ভূমিকায় অবতীর্ণ হবো। আমরা হয়ত সেই মানুষকেই গুরুত্ব দেব যে বলবে, এই দ্যাখো, AI-এর তৈরি হাজারটা আইডিয়ার মধ্যে এই আইডিয়াটা আমাদের আত্মার সাথে কীভাবে সংযোগ ঘটাচ্ছে।

 

আমরা যদি উদ্দেশ্য (intentionality)-কে প্রাধান্য দিই তবে বায়োলজিক্যাল প্রসেস বা ভাবনাই হলো উৎকৃষ্ট। আবার যদি প্রাপ্তি বা পরিণতির দিক থেকে দেখি তাহলে সিন্থেটিক আইডিয়া হলো উৎকৃষ্ট।

 

আসলে, এককভাবে কোনটাই হয়ত আমাদের জীবনে আর থাকবে না। মানুষ ও মেশিনের যৌথ উদ্যোগকেই আমরা এখন প্রধানত মূল্য দেব। ভাবা যেতে পারে, এটা একটা হাইব্রিড মডেল। ইংরেজিতে একটা সুন্দর কথা আছে, centaur (সেন্টোর)! গ্রীক পুরাণ (Greek mythology) থেকে kentauros শব্দটা ল্যাটিন হয়ে ইংরেজিতে centaur হয়েছে। দাবা খেলার ক্ষেত্রে ইতিমধ্যেই এই পরিভাষা চালু আছে, যেখানে ট্রেনিং-এর সময় মানুষ ও মেশিন মিলে দাবার চাল বিশ্লেষণ করে, নতুন আইডিয়া নিয়ে ভাবে।

 

তাহলে, এরকম ভাবা যেতে পারে – শুধুমাত্র মানুষের ভাবনা অথবা শুধুমাত্র মেশিনের ‘ভাবনা’ ক্ষেত্রবিশেষে আবশ্যিক হবেই কিন্তু, তারা একযোগে কাজ করলে, অত্যন্ত দ্রুততার সাথে প্রসেস করা ভাবনাগুলোর সাথে যদি আমাদের সমানুভূতি (empathy), আমাদের জীবনবোধ যুক্ত হতে পারে তবে তা হয়ে উঠবে একটা প্রকৃত centaur product! নতুন দিনের নতুনরকম সৃষ্টি!

 

(চলবে)

Leave a Reply

Your email address will not be published. Required fields are marked *

17 − 15 =