বেশি পুরস্কার শেখার মান কমায়

বিজ্ঞানভাষ সংবাদদাতা

Posted on ৩ মার্চ, ২০২৬

শেখার ধরন অনেক রকম। তার মধ্যে সবচেয়ে সহজ ও মৌলিক ধরনটি হলো “অ্যাসোসিয়েটিভ লার্নিং” বা অনুষঙ্গ ভিত্তিক শেখা। এখানে আমরা একটি ঘটনার সঙ্গে আরেকটি ঘটনার সম্পর্ক গড়ে তুলতে শিখি। যেমন, ঘণ্টার শব্দ মানেই খাবার। প্যাভলভের-এর সেই বিখ্যাত কুকুর-পরীক্ষায় দেখা গিয়েছিল, কয়েকবার ঘণ্টা বাজিয়ে খাবার দেওয়ার পর কুকুর শুধু ঘণ্টার শব্দ শুনেই লালা ঝরাতে শুরু করে। দীর্ঘদিন ধরে বিজ্ঞানীদের ধারণা ছিল, যত বেশি বার সংকেত (উদ্দীপক) ও পুরস্কার একসঙ্গে দেওয়া হবে, শেখা তত দ্রুত ও মজবুত হবে। অর্থাৎ, বেশি অনুশীলন মানেই ভালো ফল। কিন্তু এই সরল ধারণাকে প্রশ্নের মুখে দাঁড় করিয়েছে বিজয় মোহন কে. নাম্বুদিরি এবং ডেনিস বার্ক-এর নতুন গবেষণা। এঁরা ইউনিভার্সিটি অব ক্যালিফোর্নিয়া, সান ফ্রান্সিসকো-এর স্নায়ুবিজ্ঞানী। তাঁরা একদল ইঁদুরকে একটি নির্দিষ্ট আওয়াজের সঙ্গে মিষ্টি জলের সম্পর্ক শেখান। শব্দটা বাজানো হতো, তারপর দেওয়া হতো চিনি মেশানো জল। তবে পরীক্ষায় একটি গুরুত্বপূর্ণ পরিবর্তন আনা হয়। সেটা হল শিক্ষণ-পর্বগুলির মাঝে সময়ের ব্যবধান। একদল ইঁদুরকে প্রতি ৩০ থেকে ৬০ সেকেন্ড অন্তর এই অভিজ্ঞতা দেওয়া হল। অন্য একটি দলকে অপেক্ষা করতে হল ৫ থেকে ১০ মিনিট। অর্থাৎ দ্বিতীয় দল কম সংখ্যক পুরস্কার পেল। স্বাভাবিক ধারণা অনুযায়ী, প্রথম দল দ্রুত শিখবে। কিন্তু ফলাফল তেমনটা হল না। দেখা গেল দুই দলই প্রায় একই গতিতে শেখে। নাম্বুদিরি ব্যাখ্যা করে বলেন, সংকেত আর পুরস্কারের মধ্যবর্তী সময়ের ব্যবধান মস্তিষ্ককে ঠিক করে দিতে সাহায্য করে, কোন অভিজ্ঞতা থেকে কতটা শেখা হবে। অর্থাৎ, খুব ঘন ঘন পুরস্কার দিলে তার প্রভাব ধীরে ধীরে কমে আসে। এই ফলাফল আমাদের পরিচিত এক বাস্তব অভিজ্ঞতার সঙ্গে মিলে যায়। পরীক্ষার আগে রাত জেগে তেড়ে মুখস্থ করা স্বল্পমেয়াদে কিছু ফল দিলেও দীর্ঘমেয়াদে খুব কার্যকর হয় না। বরং সেমিস্টার জুড়ে নিয়মিত বিরতি দিয়ে পড়লে সেই শেখা স্থায়ী হয়। বার্কের ভাষায়, “ অনুষঙ্গ ভিত্তিক শেখার প্রক্রিয়া বলতে কেবল ‘অনুশীলনই মানুষকে নিখুঁত করে’ বোঝায় না, বরং ‘উপযুক্ত সময়ের ব্যবধান’ই হল আসল চাবিকাঠি।’ এইভাবে শেখার প্রক্রিয়ায় গুরুত্বপূর্ণ ভূমিকা পালন করে ডোপামিন। এটি মস্তিষ্কের এক ধরনের স্নায়ু- বার্তাবহ, যা আনন্দ ও প্রত্যাশার সঙ্গে সম্পর্কযুক্ত। শেখবার সময় আমাদের মস্তিষ্ক পুরস্কার পাওয়ার আগেই ডোপামিন নিঃসরণ শুরু করে দেয়, যেন ভবিষ্যৎ আনন্দের পূর্বাভাস দিচ্ছে। ইঁদুরদের মস্তিষ্ক বিশ্লেষণ করে গবেষকেরা দেখেন, যেসব ইঁদুরের শিক্ষণ-পর্বগুলির মাঝে মাঝে দীর্ঘ বিরতি ছিল, তারা তুলনামূলকভাবে কম সংখ্যক পরীক্ষার পরই ডোপামিন নিঃসরণ শুরু করে দেয়। অর্থাৎ কম অভিজ্ঞতা হলেও তাদের শেখা দ্রুত সক্রিয় হয়। অন্যদিকে, ঘন ঘন পুরস্কার পাওয়া ইঁদুরদের বেশিবার পরীক্ষা দিতে হয় একই পর্যায়ে পৌঁছাতে। সহজ ভাষায়, যেসব ইঁদুর বিরতি দিয়ে শিখেছে তারা “কম খরচে বেশি লাভ” পেয়েছে। একই শেখা, কিন্তু পুনরাবৃত্তি কম। এরপর গবেষকেরা আরেকটি পরীক্ষা চালান। এবার সব ইঁদুরকেই ৬০ সেকেন্ড অন্তর অন্তর শব্দ শোনানো হল, কিন্তু একদলকে মাত্র ১০ শতাংশ ক্ষেত্রে পুরস্কার দেওয়া হল। আশ্চর্যের ব্যাপার, এই দলটিও কমবার পরীক্ষা দিয়েই ডোপামিন নিঃসরণ শুরু করে দিল – পুরস্কার পাক বা না পাক। এই ফলাফল থেকে বোঝা যায়, অনিশ্চয়তা আর প্রতীক্ষা মস্তিষ্কের শেখার প্রক্রিয়াকে আরও সংবেদনশীল করে তোলে। ঘন ঘন ও নিশ্চিত পুরস্কার মস্তিষ্ককে “অভ্যস্ত” করে দেয়, ফলে প্রতিবারের অভিজ্ঞতা থেকে শেখার মান কমে যায়। এই গবেষণা আমাদের শেখা ও আসক্তি- দুটি বিষয় নিয়েই নতুনভাবে ভাবতে বাধ্য করতে পারে, কারণ আসক্তিও ডোপামিন-নিয়ন্ত্রিত একটি প্রক্রিয়া। ভবিষ্যতে নাম্বুদিরি এই ধারণা কৃত্রিম বুদ্ধিমত্তায় প্রয়োগ করতে চান। তাঁর মতে, যদি এমন একটি মডেল তৈরি করা যায় যা কম অভিজ্ঞতা থেকে দ্রুত শিখতে পারে, তাহলে যন্ত্রও অনেক দক্ষ হয়ে উঠবে। তবে আপাতত একটি বিষয় স্পষ্ট, আমাদের মস্তিষ্ক এখনও যন্ত্রের চেয়ে দ্রুত ও দক্ষভাবে শেখে। আর এই গবেষণা দেখাচ্ছে, তার রহস্য লুকিয়ে আছে পুনরাবৃত্তিতে নয়, বরং সময়ের সঠিক ব্যবধানের মধ্যে।

সূত্র: Nautilus, February 20, 2026

বেশি পুরস্কার শেখার মান কমায়

বেশি পুরস্কার শেখার মান কমায়

এই নিবন্ধটি ছড়িয়ে দিন

Leave a Reply Cancel reply