AI এসে গেছে (পর্ব ৪)

অভিজিৎ কর গুপ্ত

পদার্থ বিজ্ঞানের অধ্যাপক, পাঁশকুড়া বনমালী কলেজ (অটোনমাস)

Posted on ১০ মে, ২০২৬

“Attention is all you need!” এটা আধুনিক AI-এর জগতে একটা যুগান্তকারী গবেষণা পত্রের শিরোনাম (মূলত: গুগুলের এ আই গবেষকদের অবদান, ২০১৭) । এ যেন শুধু এক এলগোরিদম নয়, আধুনিক জেনারেটিভ AI-এর অসম্ভব কান্ডকারখানার নেপথ্যে থাকা এক রহস্যময় মন্ত্র (secret sauce)! chatGPT, Gemini, Claude, Copilot, Deepseek-এর মতো বড় AI অ্যাপগুলো, বা এজেন্টিক AI – এরা একরকম attention mechanism অথবা বাংলা করে বললে মনোযোগের কায়দার উপর নির্ভরশীল। নিউরাল নেটওয়ার্ক-এর এক বিশেষ আর্কিটেকচার, যার নাম ট্রান্সফর্মার (Transformer) আর তার সাথে আছে এই মনোযোগ নির্ভর LLM (Large Language Model)।

মানুষের ভাষা (Natural language) বুঝে ফেলছে মেশিন। মানুষের চাহিদা আর মনের কথা বুঝে নিয়ে অনায়াসে সব উত্তর দিচ্ছে AI, পর্যাপ্ত ট্রেনিং হওয়ার পর প্যাটার্ন বুঝে অভূতপূর্ব সব সিদ্ধান্ত নিচ্ছে, আর অনবদ্য সব সৃষ্টি করে চলেছে সে।

Self attention! আসলে, খুবই স্বাভাবিক একটা ভাবনা। আমরা যখন ভাষার ব্যবহার করে কোন কিছু প্রকাশ করি, তা সে গল্প কাহিনি, ইতিহাস বিজ্ঞান বা যাকিছুই হোক না কেন, একটা টেক্সট বা কোন লেখা অথবা কোন স্ক্রিপ্ট বা কোড, সবকিছুর ভিতরেই এক একটা শব্দ বা শব্দাংশ বা সিম্বল অন্যদের সাথে কীভাবে সম্পর্কিত তা দেখতে হয়, তা সে তার ভিতর যেখানেই অবস্থান করুক, তাদের মধ্যের কানেকশান টা গুরুত্বপূর্ণ। আমরা নিজেরা সেসব বুঝি, কিন্তু, মেশিন বুঝবে কী করে? এর পিছনের অঙ্ক আর এলগোরিদম-এর নিয়মকানুনই হলো LLM! যেমন ধরা যাক, যদি বলা হয়, ‘তুমি পরীক্ষায় রসগোল্লা পাবে।’। এখন এই রসগোল্লা যে সত্যিকারের রসগোল্লা নয়, বরং পরীক্ষার সাথে যুক্ত কিছু ব্যাপার, এই জায়গাটাতেই মনযোগ দিতে হবে, কানেকশান বা সম্পর্ক খুঁজতে হবে। একটা লেখার সমস্ত অংশগুলো-কে (দাঁড়ি কমা সবকিছু সহ) একেকটি ইউনিট বা টোকেন হিসাবে নাম্বারিং করে তারপর তাদেরকে এক একটা ভেক্টরে পরিণত করা হয় (একে বলে এম্বেডিং)।

ভেক্টর মানে হলো অনেক সংখ্যার একটা একমাত্রিক সংগ্রহ। যেমন, যদি বলা হয়, (2, 3, 4) একটা ভেক্টর। এভাবে ভাবতে পারা যায়, এর মানে, এখান থেকে ডানদিকে 2 ঘর যাও, তারপর লম্ব বরাবর সামনের দিকে 3 ঘর যাও, তারপর উপরের দিকে 4 ঘর যাও। এই ভেক্টর তিনমাত্রার মধ্যে অবস্থান করছে। সুতরাং আমরা সহজেই বুঝে নিতে পারি। কিন্তু, যদি একেকটা ভেক্টর থাকে 1000 বা 10,000 মাত্রার স্পেসে (ভেক্টরগুলোতে অতগুলোই সংখ্যা বা অংশ আছে ভাবতে হবে), তাহলে? আসলে এই টোকেনগুলোর জন্য বানানো বিরাট সাইজের ভেক্টরগুলো একটা বিশাল মাত্রার ভেক্টর স্পেসে কোথাও অবস্থান করবে। তাদের অবস্থান, নিজেদের মধ্যে দূরত্ব, তাদের মধ্যের কৌনিক মাপ ইত্যাদি অঙ্ক আর জ্যামিতি হিসাব করে কে কার সাথে কিভাবে জুড়ে অর্থ তৈরি করছে এই নিয়ে লিনিয়ার এলজ্যাবরা (Linear Algebra)-র অঙ্ক করা হয়। মেশিন একটা টেক্সট পড়ে ভেক্টরগুলোর মধ্যে গাণিতিক সম্পর্ক থেকে বুঝে নেয় টোকেনগুলো কার সাথে কীভাবে যুক্ত হয়ে অর্থবহ হয়ে উঠছে। আর উত্তর দেবার সময় কোন টোকেন আসবে তার সম্ভাব্যতা হিসাব করে একেক করে বলতে থাকে। আমরা ভাবি মেশিন কী সুন্দর আমাদের মতো চিন্তা করে সব বুঝে যাচ্ছে আর বলছে। তবে, তার নাগাল আমরা বুঝতে পারি না সহজে। একটা ধারণা করতে পারি মাত্র। এই যেমন ধরা যাক, King – Man + Woman = Queen! এটা একটা সরল অঙ্ক। আসলে এটাই দেখার যে, প্রম্পট-এ দেওয়া এই শব্দগুলোর ভিতরে AI কীভাবে কানেকশান তৈরি করে একটা সুযোগ্য উত্তর তৈরি বের করে আনছে। এর আড়ালে আসল অঙ্ক যা আছে তা এখন থাক। কিন্তু, এই শব্দগুলো যদি একেকটা টোকেন হয় তবে তাদের মধ্যে এই অঙ্কের সম্পর্ক থেকে অর্থ-টা সহজেই আমরা অনুমান করতে পারি। ছবি দিয়েও এসব সরল অঙ্ক করা যায়। বেশ মজার একটা ব্যাপার! এই যেমন Gemini AI সেদিন ভ্যান গখ-এর বিখ্যাত ছবি Starry Night থেকে Paint বিয়োগ করে তার সাথে Physics যোগ করে দেখালো কেমন Fluid Dynamics-এর একটা ছবি হয়ে উঠছে সেটা।

তবে, আমরা মানুষেরা যেভাবে ভাবি, তা হল মূলত সিরিয়াল থিংকিং অর্থাৎ পরপর ঘটনাগুলোর ভিতর সংযোগ স্থাপন করতে করতে যাই আমরা। একেকটা ন্যারেটিভ তৈরি হয় মনের ভিতর। AI-এর ক্ষেত্রে এসব ন্যারেটিভের ব্যাপার নেই, কেননা আমাদের মতো তার কোন অনুভব নেই। কৃত্রিম নিউরনদের কোটি কোটি সংযোগ-কে সমান্তরাল ভাবে প্রসেস করে সে চটজলদি উত্তর দেয়। কিন্তু, উত্তর যা দিচ্ছে তা তো জেনুইন – একেবারে সত্যি! আমাদের সঙ্গে মনের মতো গল্প করছে, আমাদের ভাবনা-কে চালিত করছে। যদি ভাবি, AI-এর তো আমাদের মতো কোন ‘মন’ নেই, তাহলে এইসব ভাবনা যা ভাবছে আর আমাদের ভাবাচ্ছে তার জন্য সে কীভাবে ভেবে বলছে। তার ভাবনাটাকে ফেক বলা যাবে না, তা আদ্যন্তই জেনুইন। উত্তরে পৌঁছানোর জন্য তার নির্দিষ্ট পথ আছে। একে আর্টিফিসিয়াল ইন্টেলিজেন্স না বলে বরং হয়ত সিন্থেটিক ইন্টেলিজেন্স বলা যেতে পারে। সেই অর্থে কৃত্রিম নয় আবার মানুষের মতো এর ফিলিং বা অনুভবও নেই।

যদি তর্ক করা যায়, একজন মানুষও যখন কথা বলছেন তখন তার মানের ভিতরে কী হচ্ছে, তার মগজে তিনি কীভাবে কম্পিউট করছেন, সেসব ইন্টারনাল প্রসেস নিয়ে কি আমরা বোঝার চেষ্টা করতে থাকি নাকি আমরা তার সঙ্গে অর্থবহ আলোচনা উপভোগ করি? যেকোন AI-এর সাথে তো আমরা ঘণ্টার পর ঘণ্টা ভীষণ বুদ্ধিদীপ্ত, সফিস্টিকেটেড আলোচনা চালিয়ে যেতে পারি।

আসলে, আমাদের বায়োলজিক্যাল ভাবনা প্রভাবিত হয় হোমিওস্ট্যাসিস-এর আইডিয়া দিয়ে। আমাদের ভাবনাগুলো জাগতিক। জগতের সাথে আমরা সংযোগ স্থাপন করি আমাদের বেঁচে থাকার তাগিদে। আমাদের ক্ষুধা, আমাদের ভয়, আমাদের ভালোবাসা, আকর্ষণ, উত্তেজনা অথবা আমাদের পরিশ্রান্ত হয়ে পড়া এসবই আমাদের চিন্তাকে প্রভাবিত করে। আমাদের ভাবনা তাই কখনো এলোমেলো, আবেগতাড়িত। আমরা তার প্রকাশ ঘটাই। কিন্তু, AI-এর ক্ষেত্রে এসব ব্যাপার নেই। সবকিছুই একটা লক্ষ্য নিয়ে করা (goal oriented), একটা অবজেক্টিভ নির্ভর। বায়োলজিকালি ফিলিং-এর বদলে গাণিতিক লস ফাংশান (loss function) এখানে তাকে নির্দিষ্ট লক্ষ্যে চালিত করে। আমরা একে স্বভাবতই ‘ভাবনা’ বলি না, একটা প্রসেস মাত্র। কিন্তু, এটাও তো ঠিক, আমাদের ভাবনার প্রসেস যদি একটা রাস্তা হয় তাহলে AI-এর ভিতরকার প্রসেসও আরেকটা রাস্তা! কৃত্রিম নিউরাল নেটওয়ার্ক-কে যদি আমরা একটা ব্রেইন ভাবি, তাহলে সেই ব্রেইন বা মস্তিষ্কের মধ্যে যে প্রসেস চলে, তা থেকে অসম্ভব কিছু ভাবনার প্রকাশ তো আমরা দেখতেই পাচ্ছি বিজ্ঞান-সাহিত্য-শিল্প-দর্শন-এ। যেসব তথ্য-কে আমরা নয়েজ ভেবেছি, ফেলে দেওয়ার মতো ভেবেছি, তার ভিতর থেকে লক্ষ লক্ষ প্রোটিন স্ট্রাকচার বুঝে নেওয়া আর ড্রাগ ডিজাইন করা, এ তো এক অভূতপূর্ব ভাবনারই প্রকাশ!

আসলে, ড্রাগ ডিজাইন বা এয়ারোডাইনামিকস-এর নতুন নতুন ভাবনা থেকে শুরু করে অঙ্কের দীর্ঘকলের অমীমাংসিত প্রবলেম-এর সমাধান করা, শিল্প-সাহিত্য সৃষ্টি করা ইত্যাদি যা কিছু অসাধ্য সাধন AI করছে তাকে আমরা ফাংশনালিটির দিক থেকেই দেখছি। মানুষের মতো তার কষ্ট (suffering), আর সংগ্রামের দিকটা নেই বলে মনে করছি। অবশ্য, আমাদের সমাজে বিজ্ঞান, অঙ্ক বা ইঞ্জিনিয়ারিং-এর ক্ষেত্রেও এরকমটা হয়, স্রষ্টার কষ্ট বা স্ট্রাগল চোখে পড়ে না। আমরা ফাংশানালিটিতেই আটকে পড়ি। কিন্তু, শিল্প সৃষ্টি বা ক্রাফট তৈরির ক্ষেত্রে আমরা মানুষের কষ্ট, প্রসেস-এর অপ্রতুলতা সরাসরি দেখতে পাই। তাই আমাদের কাছে এর গুরুত্ব, এর পিছনের ভাবনা ও শ্রমের প্রতি আমাদের দরদ অনুভূত হয়। সেজন্য একটা প্রিন্ট করা চিঠির চাইতে হাতে লেখা চিঠিকে আমরা বেশি মূল্য দিই কারণ সেখানে লেখকের শ্রম ও প্রচেষ্টা, তার কিছু আত্মবলিদানের একটা ছাপ যেন থেকে যায় এতে।

অবশ্যই AI আমাদের মতো নয়। সে আমাদের মতো বিবর্তনের প্রক্রিয়ার মধ্যে দিয়ে আসে নি। অর্থনীতির দিক থেকে যে ভাবনাটা অপ্রতুল তাকেই আমরা বেশি গুরুত্ব দিই। AI প্রতি মুহুর্তে কোটি কোটি ভালো ভাবনা জেনারেট করে চলেছে। কাজেই এত ভাবনার প্রাচুর্যের মধ্যে সেসবের মূল্য শূন্যের কাছাকাছি চলে যেতেই পারে!

তাহলে, এই AI-এর যুগে ভাবনার এই প্রাচুর্য-এর সামনে দাঁড়িয়ে আমাদের ভূমিকা কী হবে? নতুন নতুন ভাবনা সৃষ্টির ভূমিকা যদি আমাদের কাছ থেকে AI-এর আয়ত্তে চলে যায় তাহলে আমরা কী করব? আমরা হয়ত স্রষ্টার ভূমিকা ছেড়ে, তত্ত্বাবধান (curation) আর বৈধতা যাচাই (validation)-এর ভূমিকায় অবতীর্ণ হবো। আমরা হয়ত সেই মানুষকেই গুরুত্ব দেব যে বলবে, এই দ্যাখো, AI-এর তৈরি হাজারটা আইডিয়ার মধ্যে এই আইডিয়াটা আমাদের আত্মার সাথে কীভাবে সংযোগ ঘটাচ্ছে।

আমরা যদি উদ্দেশ্য (intentionality)-কে প্রাধান্য দিই তবে বায়োলজিক্যাল প্রসেস বা ভাবনাই হলো উৎকৃষ্ট। আবার যদি প্রাপ্তি বা পরিণতির দিক থেকে দেখি তাহলে সিন্থেটিক আইডিয়া হলো উৎকৃষ্ট।

আসলে, এককভাবে কোনটাই হয়ত আমাদের জীবনে আর থাকবে না। মানুষ ও মেশিনের যৌথ উদ্যোগকেই আমরা এখন প্রধানত মূল্য দেব। ভাবা যেতে পারে, এটা একটা হাইব্রিড মডেল। ইংরেজিতে একটা সুন্দর কথা আছে, centaur (সেন্টোর)! গ্রীক পুরাণ (Greek mythology) থেকে kentauros শব্দটা ল্যাটিন হয়ে ইংরেজিতে centaur হয়েছে। দাবা খেলার ক্ষেত্রে ইতিমধ্যেই এই পরিভাষা চালু আছে, যেখানে ট্রেনিং-এর সময় মানুষ ও মেশিন মিলে দাবার চাল বিশ্লেষণ করে, নতুন আইডিয়া নিয়ে ভাবে।

তাহলে, এরকম ভাবা যেতে পারে – শুধুমাত্র মানুষের ভাবনা অথবা শুধুমাত্র মেশিনের ‘ভাবনা’ ক্ষেত্রবিশেষে আবশ্যিক হবেই কিন্তু, তারা একযোগে কাজ করলে, অত্যন্ত দ্রুততার সাথে প্রসেস করা ভাবনাগুলোর সাথে যদি আমাদের সমানুভূতি (empathy), আমাদের জীবনবোধ যুক্ত হতে পারে তবে তা হয়ে উঠবে একটা প্রকৃত centaur product! নতুন দিনের নতুনরকম সৃষ্টি!

(চলবে)

AI এসে গেছে (পর্ব ৪)

AI এসে গেছে (পর্ব ৪)

এই নিবন্ধটি ছড়িয়ে দিন

Leave a Reply Cancel reply