বেশি পুরস্কার শেখার মান কমায়

বেশি পুরস্কার শেখার মান কমায়

বিজ্ঞানভাষ সংবাদদাতা
Posted on ৩ মার্চ, ২০২৬

শেখার ধরন অনেক রকম। তার মধ্যে সবচেয়ে সহজ ও মৌলিক ধরনটি হলো “অ্যাসোসিয়েটিভ লার্নিং” বা অনুষঙ্গ ভিত্তিক শেখা। এখানে আমরা একটি ঘটনার সঙ্গে আরেকটি ঘটনার সম্পর্ক গড়ে তুলতে শিখি। যেমন, ঘণ্টার শব্দ মানেই খাবার। প্যাভলভের-এর সেই বিখ্যাত কুকুর-পরীক্ষায় দেখা গিয়েছিল, কয়েকবার ঘণ্টা বাজিয়ে খাবার দেওয়ার পর কুকুর শুধু ঘণ্টার শব্দ শুনেই লালা ঝরাতে শুরু করে। দীর্ঘদিন ধরে বিজ্ঞানীদের ধারণা ছিল, যত বেশি বার সংকেত (উদ্দীপক) ও পুরস্কার একসঙ্গে দেওয়া হবে, শেখা তত দ্রুত ও মজবুত হবে। অর্থাৎ, বেশি অনুশীলন মানেই ভালো ফল। কিন্তু এই সরল ধারণাকে প্রশ্নের মুখে দাঁড় করিয়েছে বিজয় মোহন কে. নাম্বুদিরি এবং ডেনিস বার্ক-এর নতুন গবেষণা। এঁরা ইউনিভার্সিটি অব ক্যালিফোর্নিয়া, সান ফ্রান্সিসকো-এর স্নায়ুবিজ্ঞানী। তাঁরা একদল ইঁদুরকে একটি নির্দিষ্ট আওয়াজের সঙ্গে মিষ্টি জলের সম্পর্ক শেখান। শব্দটা বাজানো হতো, তারপর দেওয়া হতো চিনি মেশানো জল। তবে পরীক্ষায় একটি গুরুত্বপূর্ণ পরিবর্তন আনা হয়। সেটা হল শিক্ষণ-পর্বগুলির মাঝে সময়ের ব্যবধান। একদল ইঁদুরকে প্রতি ৩০ থেকে ৬০ সেকেন্ড অন্তর এই অভিজ্ঞতা দেওয়া হল। অন্য একটি দলকে অপেক্ষা করতে হল ৫ থেকে ১০ মিনিট। অর্থাৎ দ্বিতীয় দল কম সংখ্যক পুরস্কার পেল। স্বাভাবিক ধারণা অনুযায়ী, প্রথম দল দ্রুত শিখবে। কিন্তু ফলাফল তেমনটা হল না। দেখা গেল দুই দলই প্রায় একই গতিতে শেখে। নাম্বুদিরি ব্যাখ্যা করে বলেন, সংকেত আর পুরস্কারের মধ্যবর্তী সময়ের ব্যবধান মস্তিষ্ককে ঠিক করে দিতে সাহায্য করে, কোন অভিজ্ঞতা থেকে কতটা শেখা হবে। অর্থাৎ, খুব ঘন ঘন পুরস্কার দিলে তার প্রভাব ধীরে ধীরে কমে আসে। এই ফলাফল আমাদের পরিচিত এক বাস্তব অভিজ্ঞতার সঙ্গে মিলে যায়। পরীক্ষার আগে রাত জেগে তেড়ে মুখস্থ করা স্বল্পমেয়াদে কিছু ফল দিলেও দীর্ঘমেয়াদে খুব কার্যকর হয় না। বরং সেমিস্টার জুড়ে নিয়মিত বিরতি দিয়ে পড়লে সেই শেখা স্থায়ী হয়। বার্কের ভাষায়, “ অনুষঙ্গ ভিত্তিক শেখার প্রক্রিয়া বলতে কেবল ‘অনুশীলনই মানুষকে নিখুঁত করে’ বোঝায় না, বরং ‘উপযুক্ত সময়ের ব্যবধান’ই হল আসল চাবিকাঠি।’ এইভাবে শেখার প্রক্রিয়ায় গুরুত্বপূর্ণ ভূমিকা পালন করে ডোপামিন। এটি মস্তিষ্কের এক ধরনের স্নায়ু- বার্তাবহ, যা আনন্দ ও প্রত্যাশার সঙ্গে সম্পর্কযুক্ত। শেখবার সময় আমাদের মস্তিষ্ক পুরস্কার পাওয়ার আগেই ডোপামিন নিঃসরণ শুরু করে দেয়, যেন ভবিষ্যৎ আনন্দের পূর্বাভাস দিচ্ছে। ইঁদুরদের মস্তিষ্ক বিশ্লেষণ করে গবেষকেরা দেখেন, যেসব ইঁদুরের শিক্ষণ-পর্বগুলির মাঝে মাঝে দীর্ঘ বিরতি ছিল, তারা তুলনামূলকভাবে কম সংখ্যক পরীক্ষার পরই ডোপামিন নিঃসরণ শুরু করে দেয়। অর্থাৎ কম অভিজ্ঞতা হলেও তাদের শেখা দ্রুত সক্রিয় হয়। অন্যদিকে, ঘন ঘন পুরস্কার পাওয়া ইঁদুরদের বেশিবার পরীক্ষা দিতে হয় একই পর্যায়ে পৌঁছাতে। সহজ ভাষায়, যেসব ইঁদুর বিরতি দিয়ে শিখেছে তারা “কম খরচে বেশি লাভ” পেয়েছে। একই শেখা, কিন্তু পুনরাবৃত্তি কম। এরপর গবেষকেরা আরেকটি পরীক্ষা চালান। এবার সব ইঁদুরকেই ৬০ সেকেন্ড অন্তর অন্তর শব্দ শোনানো হল, কিন্তু একদলকে মাত্র ১০ শতাংশ ক্ষেত্রে পুরস্কার দেওয়া হল। আশ্চর্যের ব্যাপার, এই দলটিও কমবার পরীক্ষা দিয়েই ডোপামিন নিঃসরণ শুরু করে দিল – পুরস্কার পাক বা না পাক। এই ফলাফল থেকে বোঝা যায়, অনিশ্চয়তা আর প্রতীক্ষা মস্তিষ্কের শেখার প্রক্রিয়াকে আরও সংবেদনশীল করে তোলে। ঘন ঘন ও নিশ্চিত পুরস্কার মস্তিষ্ককে “অভ্যস্ত” করে দেয়, ফলে প্রতিবারের অভিজ্ঞতা থেকে শেখার মান কমে যায়। এই গবেষণা আমাদের শেখা ও আসক্তি- দুটি বিষয় নিয়েই নতুনভাবে ভাবতে বাধ্য করতে পারে, কারণ আসক্তিও ডোপামিন-নিয়ন্ত্রিত একটি প্রক্রিয়া। ভবিষ্যতে নাম্বুদিরি এই ধারণা কৃত্রিম বুদ্ধিমত্তায় প্রয়োগ করতে চান। তাঁর মতে, যদি এমন একটি মডেল তৈরি করা যায় যা কম অভিজ্ঞতা থেকে দ্রুত শিখতে পারে, তাহলে যন্ত্রও অনেক দক্ষ হয়ে উঠবে। তবে আপাতত একটি বিষয় স্পষ্ট, আমাদের মস্তিষ্ক এখনও যন্ত্রের চেয়ে দ্রুত ও দক্ষভাবে শেখে। আর এই গবেষণা দেখাচ্ছে, তার রহস্য লুকিয়ে আছে পুনরাবৃত্তিতে নয়, বরং সময়ের সঠিক ব্যবধানের মধ্যে।

 

সূত্র: Nautilus, February 20, 2026

Leave a Reply

Your email address will not be published. Required fields are marked *

10 − 3 =