গণিতজ্ঞ কৃ বু

গণিতজ্ঞ কৃ বু

বিজ্ঞানভাষ সংবাদদাতা
Posted on ১৪ ডিসেম্বর, ২০২৫

চীনের কৃত্রিম বুদ্ধিমত্তা (কৃ বু) কোম্পানি ‘ডিপসিক’ এমন এক নতুন গণিত-তর্ক নির্ভর মডেল তৈরি করেছে, যা নিজের ভুল নিজেই শনাক্ত করতে এবং সংশোধন করতে পারে। মডেলটি বিশ্বের অন্যতম মর্যাদাপূর্ণ গণিত প্রতিযোগিতা ‘উইলিয়াম লোয়েল পুটনাম ম্যাথমেটিক্যাল কম্পিটিশন’–এ মানুষের সেরা স্কোরকেও ছাপিয়ে গেছে। DeepSeekMath-V2 নামের মডেলটি ২০২৪ সালের পুটনাম পরীক্ষার প্রশ্নে ১২০-এর মধ্যে ১১৮ নম্বর পেয়েছে, তুলনায় মানুষের সেরা স্কোর ছিল ৯০। একই সঙ্গে এটি ২০২৫ সালের আন্তর্জাতিক গণিত অলিম্পিয়াড এবং ২০২৪ সালের চায়না ম্যাথমেটিক্যাল অলিম্পিয়াডে স্বর্ণপদকজয়ী শিক্ষার্থীদের সমতুল্য পারফরম্যান্স দেখিয়েছে। ইম্পেরিয়াল কলেজ লন্ডনের গণিতবিদ কেভিন বাজার্ড বলেন, “আমরা এমন এক পর্যায়ে পৌঁছে গেছি, যেখানে কৃত্রিম বুদ্ধিমত্তা একজন মেধাবী স্নাতক শিক্ষার্থীর মতোই ভালো অঙ্ক কষতে পারে। এটা অত্যন্ত রোমাঞ্চকর।” এর আগে ২০২৪ সালের ফেব্রুয়ারিতে, গুগল ডিপমাইন্ডের Alpha Geometry 2 এবং পরে জুলাইয়ে জেমিনির Deep Think—উভয়ই আই এম ও-স্তরের স্বর্ণপদকের মান অর্জন করে।

 

প্রচলিত বৃহৎ ভাষা মডেলগুলিকে (LLM) প্রশিক্ষণ দেওয়ার ক্ষেত্রে, সাধারণত চূড়ান্ত উত্তরের উপরই গুরুত্ব দেওয়া হতো। কিন্তু গবেষকদের মতে, সঠিক উত্তর মানেই সঠিক যুক্তি নয়। কখনও কখনও ভুল যুক্তি থেকেও কাকতালীয়ভাবে সঠিক উত্তর আসতে পারে। অথচ অঙ্কের ক্ষেত্রে, বিশেষ করে প্রমাণভিত্তিক সমস্যার ক্ষেত্রে, যুক্তির মানটাই সবচেয়ে গুরুত্বপূর্ণ। অস্ট্রেলিয়ার UNSW সিডনির গবেষক টং জি জানান, DeepSeek এবং Gemini-এর গবেষকেরা উত্তর নয়, বরং যুক্তিভিত্তিক পদক্ষেপগুলিকে পুরস্কৃত করার দিকে জোর দিচ্ছেন। যাতে মডেলগুলি মানুষের মতো ধাপে ধাপে ভাবতে শেখে। DeepSeekMath-V2 প্রথমবার ‘স্ব-যাচাইযোগ্য যুক্তিবোধ’এর ধারণা প্রয়োগ করেছে। মডেলটির তিনটি প্রধান অংশ-

ক. প্রমাণ নির্মাতা : ধাপে ধাপে যুক্তি সাজিয়ে উত্তর তৈরি করে।

 

খ. যাচাই কারক : সেই যুক্তিগুলোর যৌক্তিক মান যাচাই করে, কোথায় ত্রুটি আছে তা চিহ্নিত করে নম্বর দেয়।

 

গ. প্রশস্ত যাচাই ব্যবস্থা : যাচাই কারকের মন্তব্য বা সমালোচনাগুলো কতটা যুক্তিসঙ্গত, তা আবার যাচাই করে। ফলত ভুল বিশ্লেষণের সম্ভাবনা কমে যায়।

এই তিন স্তরের প্রতিক্রিয়া-চক্রের ফলে যুক্তি নির্মাতা যতই কঠিন যুক্তি তৈরি করে, ততই সে প্রশিক্ষিত হবার সুযোগ পায়। এই কঠিন যুক্তিগুলিকেই, সে পরবর্তী ধাপের প্রশিক্ষণ তথ্য হিসেবে ব্যবহার করে। ফলে, যুক্তি নির্মাতা আরও শক্তিশালী হতে থাকে। এই পদ্ধতিতেই IMO ২০২৫-এর ছয়টি প্রশ্নের মধ্যে পাঁচটি সমাধান করতে সক্ষম হয়েছে (৮৩.৩%) ডিপসিক২।

 

তবে সেটের সবচেয়ে কঠিন সমস্যাগুলো এখনও মডেলের নাগালের বাইরে। Math-V2 মূলত প্রাকৃতিক ভাষা ব্যবহার করে নিজের যুক্তিগুলিকে যাচাই করে। যা এটিকে কম ব্যয়বহুল ও সহজে স্কেলযোগ্য করেছে। অন্যদিকে জেমিনির Deep Think যুক্তি যাচাই করতে, Lean নামের এক প্রতীকি ভাষা ব্যবহার করে। যা অত্যন্ত নির্ভুল হলেও ব্যয়বহুল ও উচ্চমানের বিশেষজ্ঞের ইনপুট নির্ভর। গবেষকেরা বলছেন, ভাষাভিত্তিক যুক্তি দেখিয়ে দেয়, ভবিষ্যতে কৃ বু আরও মানুষের মতন করে গাণিতিক চিন্তাভাবনা করতে পারবে। এটি গবেষণা–পর্যায়ের সমস্যা সমাধানে বড় ভূমিকা রাখতে পারে। DeepSeekMath-V2 থেকে গবেষকেরা কোনো মডেল বিনামূল্যে ডাউনলোড করে নিজেদের মতো করে প্রশিক্ষণ দিতে পারবেন। কেভিন বাজার্ড মনে করেন, মডেলটি সম্ভবত ৫ মিলিয়ন ডলারের ‘AI Mathematical Olympiad Prize’ জয়ের দাবিদার হতে পারে। তবে তার মতে, IMO–তে স্বর্ণপদক অর্জন গবেষণা–স্তরের গণিতের প্রকৃত দক্ষতার সমান নয়। গবেষকেরা বলছেন, এটি ভবিষ্যতে উচ্চস্তরের গণিত সমস্যার সমাধান ও নতুন জ্ঞান আবিষ্কারের ক্ষেত্রে এক গুরুত্বপূর্ণ পদক্ষেপ হয়ে উঠতে পারে।

 

সূত্র : DeepSeek’s self-correcting AI model aces tough maths proofs The mathematical reasoning model performed as well as humans at prestigious international mathematics competitions; 04 December 2025.

Leave a Reply

Your email address will not be published. Required fields are marked *

6 + 16 =