কৃবুর সৃজনশীলতার গোপন কথা

কৃবুর সৃজনশীলতার গোপন কথা

বিজ্ঞানভাষ সংবাদদাতা
Posted on ৭ সেপ্টেম্বর, ২০২৫

কৃত্রিম বুদ্ধিমত্তার সাহায্যে চিত্ররূপ উৎপাদন করার হরেক ডিফিউশন মডেল আজ সুলভ। আশ্চর্যের ব্যাপার, শেখানো চিত্ররূপের হুবহু নকল না-করে এরা নতুন নতুন রীতিমতো সুবদ্ধ অর্থবহ চিত্র তৈরি করছে। এ এক কূট রহস্য। ডিফিউশন মডেল জঞ্জাল দূর করার জন্য একটা চিত্রকে প্রথমে কতকগুলো যথেচ্ছ রঙের টুকরোয় ভেঙে নিয়ে তারপর সেগুলোকে নতুন করে জোড়া লাগায়। প্রশ্ন হল, টুকরোগুলোকে জোড়া লাগানোর পর ছবিটার মধ্যে অভিনবত্ব আসছে কোথা থেকে?
ইদানীং মেসন কাম্ব আর সূর্য গাঙ্গুলি নামক দুই পদার্থবিজ্ঞানী বলছেন, ছবিটিকে জঞ্জালমুক্ত করার ওই প্রক্রিয়ার মধ্যেই লুকিয়ে রয়েছে রহস্য। তাঁরা দেখিয়েছেন, ডিফিউশন মডেলের ওই তথাকথিত অভিনব “সৃজনশীলতা” আসলে একেবারে কার্য-কারণ সূত্রে গাঁথা একটা প্রক্রিয়া। মডেলগুলোর নির্মাণ-স্থাপত্যের অবধারিত পরিণাম হিসেবেই সেগুলির উদ্ভব। ভবিষ্যতের কৃবু গবেষণায়, এমনকী মানুষের সৃজনশীলতার অনুধাবনেও, এর মস্ত প্রভাব পড়তে পারে। নেদারল্যান্ড্‌স-এর র‍্যাডবুশ বিশ্ববিদ্যালয়ের কম্পিউটার বিজ্ঞানী লিউকা অ্যাম্ব্রোজিওনির মতে, একেবারেই অকিঞ্চিৎকর নয় এমন একটা বিষয়ের নিখুঁত পূর্বাভাস দানে তা সক্ষম।

একটা সজীব সিস্টেম কীভাবে নিজেই নিজেকে গুছিয়ে তোলে, তা নিয়ে দীর্ঘদিন ভেবে চলেছেন স্ট্যানফোর্ড বিশ্ববিদ্যালয়ের ফলিত পদার্থবিজ্ঞানের গবেষক-ছাত্র মেসন কাম্ব। স্ট্যানফোর্ডের পদার্থবিদ সূর্য গাঙ্গুলির ল্যাবে কাজ করতে আসেন তিনি। সূর্যবাবু স্নায়ু-জীববিজ্ঞান আর ইলেক্ট্রিকাল ইঞ্জিয়ানিয়ারিং-এও আগ্রহী। কাম্ব দেখলেন, টুরিং প্যাটার্নের সাহায্যে মানুষ ও অন্যান্য প্রাণীর ভ্রূণ অধ্যয়ন ধাঁধাটার উত্তর পাওয়ার একটা পথ। কোষের বিভিন্ন গুচ্ছ কীভাবে নিজেদের আলাদা আলাদা অঙ্গপ্রত্যঙ্গের রূপে সংগঠিত করে তোলে, তার ব্যাখ্যা দেয় টুরিং প্যাটার্ন। এই সমন্বয়টা কিন্তু ঘটে স্থানীয় পর্যায়ে। কোষগুলির সামনে গোটা দেহের কোনো পূর্ব-নির্মিত নির্মাণ-ছক থাকে না, যা দেখে তারা কাজ করবে। নিছক প্রতিবেশীদের কাছ থেকে আসা সংকেতে সাড়া দিয়েই তারা কাজ করে, ভুল শোধরায়। এ প্রক্রিয়া মোটের ওপর ভালোই চলে। কিন্তু মাঝে মাঝে গড়বড় করে, যেমন পাঁচটার জায়গায় ছ-টা আঙুল বানিয়ে ফেলা। কৃবু-জাত চিত্ররূপগুলিও অনেক সময় কিম্ভূত কিমাকার সুর-রিয়ালিস্ট ছবির মতো, মানুষের হাতে বাড়তি আঙুল। কাম্ব-এর মনে হল, তলা থেকে গড়ে-ওঠা একটা প্রক্রিয়ায় এ ধরণের ব্যর্থতা তো প্রত্যাশিত।
ডিফিউশন মডেল দুটো শর্টকাট কৌশলে চিত্ররূপ বানায়। এক, স্থানীয়তা (লোকালিটি)। অর্থাৎ কেবল একটিমাত্র পিক্সেল-গোষ্ঠী বা “ছোপে”র ওপর দৃষ্টি নিবদ্ধ রাখা। দুই, ট্রানজিশানাল ইকুইভ্যারিয়েন্স (প্রভেদসমতা)। যেকোনো অভিমুখে একটা চিত্র-ইনপুটকে যদি দু-এক পিক্সেল সরিয়ে দেওয়া যায় তাহলে আপনা থেকেই গোটা চিত্রটিতে ওই একই পরিবর্তন ঘটাবে। এরই সুবাদে মডেলটি সুসংবদ্ধ একটি বাস্তবসম্মত কাঠামো বজায় রাখে। কিছুটা এই কারণেই ডিফিউশন মডেলগুলো ছবির চূড়ান্ত রূপটিতে একটা বিশেষ ছোপ কোথায় বসাতে হবে তা নিয়ে মাথা ঘামায় না। তাদের লক্ষ্য হল একেক বারে একেকটা ছোপ তৈরি করে সেগুলোকে ‘স্কোর ফাংশন’ নামক গাণিতিক সূত্র মাফিক আপনা থেকেই চূড়ান্ত চিত্রের ঠিক জায়গাটিতে বসিয়ে দেওয়া । দেহকোষের প্রক্রিয়ার অনুসরণে একে এক ধরণের ডিজিটাল টুরিং প্যাটার্ন বলা যেতে পারে।
আগে গবেষকদের ধারণা ছিল জঞ্জাল-মুক্ত করার প্রক্রিয়ায় এই স্থানীয়তা আর ইউনিভ্যারিয়েন্স (প্রভেদসমতা) নিছক দুই প্রকরণগত সীমাবদ্ধতা। এদেরই দরুন মডেলগুলি একেবারে হুবহু নকল চিত্র বানাতে পারে না। তাঁরা ব্যাপারটাকে আদৌ উচ্চতর সৃজনশীলতার সঙ্গে যুক্ত করে দেখেননি। কিন্তু এখানেই চমক। কাম্ব আর গাঙ্গুলি বললেন, স্থানিকতা আর প্রভেদসমতা, এ দুয়ে মিলেই গড়ে তোলে সৃজনশীলতা। তাঁরা তাঁদের তৈরি সিস্টেমটির নাম দিয়েছেন ‘ইকুইভ্যারিয়েন্ট লোকাল স্কোর’ (ই এল এস)। ডিজিটাল জঞ্জালে পর্যবসিত একপ্রস্থ চিত্রমালাকে তাঁরা চালিয়ে দিলেন এই নতুন সিস্টেমের মধ্যে, আর একই সঙ্গে জোরালো কয়েকটি ডিফিউশন মডেলের মধ্যে। সূর্যবাবুর কথায়, “ফলাফল দেখে আমরা তাজ্জব। ই এল এস মেশিন, তালিম-প্রাপ্ত ডিফিউশন মডেলের আউটপুটগুলোর সঙ্গে হুবহু মিলিয়ে দিয়েছে। গড়পড়তা নির্ভুলতা ৯০%। মেশিন লার্নিং-এর ইতিহাসে এ ঘটনা অভূতপূর্ব”।
কাম্ব-এর তত্ত্বপ্রস্তাবটি এর দ্বারা সমর্থিত হয়েছে বলে মনে করা হচ্ছে। অর্থাৎ স্থানীয়তার দরুন আপনা থেকেই সৃজনশীলতার জন্ম হয়। ডিফিউশন মডেলে ফুটে-ওঠা বাড়তি আঙুলের কারণ হল, বৃহত্তর পরিপ্রেক্ষিতের কথা মাথায় না-রেখে কেবল স্থানীয় স্তরে পিক্সেল-ছোপ তৈরি করার প্রবল ঝোঁক। নিঃসন্দেহে এ এক মস্ত অগ্রগতি। তবে সব রহস্যের উত্তর পেতে আরো গবেষণা করতে হবে।
সূত্র: https://www.quantamagazine.org/researchers-uncover-hidden-ingredients-behind-ai-creativity-20250630/

Leave a Reply

Your email address will not be published. Required fields are marked *

nine − six =