Faculty of Engineering > EEE

এসে গেছে গবেষকদের অসততা ধরার অ্যালগরিদম

(1/1)

abdussatter:
গবেষণাপত্রে নিজস্ব উপাত্তের নামে যা খুশি তা লিখে চালিয়ে দেওয়ার দিন শেষ। গবেষণাপত্রে উপস্থাপিত উপাত্তের ফাঁকফোকর পরীক্ষা ও গবেষকের অসততা ধরার পদ্ধতি চলে এসেছে। ইকোনমিস্টের এক প্রতিবেদনে বলা হয়েছে, প্রকাশিত গবেষণার ফাঁকফোকর পরীক্ষা করার উপযোগী কম্পিউটার অ্যালগরিদম তৈরি করেছেন যুক্তরাষ্ট্রের কয়েকজন গবেষক। তাঁদের তৈরি এ অ্যালগরিদম সেট জার্নাল বা সাময়িকীর সম্পাদকদের জন্য সম্ভাব্য আশীর্বাদ হয়ে উঠতে পারে।

ইকোনমিস্ট বলছে, অনেক সময় বৈজ্ঞানিক গবেষণার কাজে যেসব উপাত্ত ব্যবহার করা হয়, তা সবার জন্য উন্মুক্ত থাকে না। তখন গবেষকেদের কাছে ওই উপাত্তের উৎস সম্পর্কে জানতে চাওয়া হয়। কিন্তু অনেক সময় তা পাওয়া সম্ভব হয়ে ওঠে না। অবশ্য এখন মানসিকতার কিছু পরিবর্তন ঘটেছে। তারপরও অনেক গবেষক এখনো তাঁদের উপাত্ত উৎসের মালিকানা নিজের বলেই দাবি করে থাকেন। এসব উপাত্ত তাঁরা সংগ্রহ ও বিশ্লেষণ করে নিজেদের সিদ্ধান্তে পৌঁছেছেন বলে দাবি করে থাকেন এবং অন্য প্রতিদ্বন্দ্বীদের সঙ্গে বিনিময় করতে চান না।

গবেষকেদের এই মনোভাব ‘আত্মকেন্দ্রিক’ বলে মনে হলেও এর কারণ অজানা নয় এবং তা স্বাভাবিক বলেই মনে করা হয়। কিন্তু গবেষণার উপাত্ত নিজের বলে দাবি করার খারাপ দিকও থাকে। অনেক সময় এর মাধ্যমে গুপ্ত উদ্দেশ্য সাধন করা হতে পারে। কোনো গবেষণাপত্রে যে পরিসংখ্যান তুলে ধরা হয়, তা নির্দিষ্ট ও আকাঙ্ক্ষিত ফল অর্জনের জন্য কারসাজি করা হয়ে থাকতে পারে। অন্য অর্থে বলতে গেলে লেখক বা গবেষক প্রতারণার আশ্রয় নিতে পারেন। তিনি যদি ওই উপাত্তের প্রকৃত উৎস উন্মুক্ত করে দেন, তবে তাঁর প্রতারণার বিষয়টি সুস্পষ্ট হয়ে দাঁড়াতে পারে এবং তিনি প্রতারক হিসেবে ধরা পড়ে যেতে পারেন। তাই তিনি চান, উৎস যেন যেন গোপন থাকে।

তবে সে সুযোগ ভবিষ্যতে আর নাও থাকতে পারে। কারণ, তথ্য গোপন করা কঠিন হবে। বিশেষ করে ডেটা সেটের ক্ষেত্রে পরিচিত সীমার মধ্যে পূর্ণ সংখ্যার কোনো ডেটা সেট হলে তা আরও কঠিন হবে। যেমন মানসিক পরীক্ষার ক্ষেত্রে অনেক প্রশ্নের উত্তর। গবেষক যদি এ ধরনের ডেটা সেটের ক্ষেত্রে প্রতারণার আশ্রয় নেন, সহজেই ধরা পড়ে যাবেন।

যুক্তরাষ্ট্রের ইলিনয় বিশ্ববিদ্যালয়ের গবেষক শন উইলনার ও তাঁর সহকর্মীরা মিলে বিষয়টির একটি সমাধান বের করেছেন। তাঁরা তৈরি করেছেন বিশেষ ধরনের একটি অ্যালগরিদম। ‘সাইয়্যিভিক প্রিপ্রিন্টস’ নামের একটি গবেষণা নিবন্ধে তাঁরা বিষয়টি তুলে ধরেছেন। তাঁরা ফলাফল নির্ণায়ক যে অ্যালগরিদম তৈরি করেছেন, তার নাম দিয়েছেন ‘কমপ্লিট রিকভারি অব ভ্যালুস ইন ডায়োফ্যান্টাইন সিস্টেম বা সংক্ষেপে করভিডস।

গবেষকেরা দাবি করেছেন, কোনো গবেষণার উপাত্ত পরীক্ষার ক্ষেত্রে করভিডস কাজে লাগানো যাবে। যদি কোনো ফল দেখানোর সময় করভিডসে বৈধ ডেটা সেট দেখাতে না পারে, তবে ওই ফলাফল সুস্পষ্টভাবেই সন্দেহজনক বলে ধরতে হবে। যদি তা সুসংগঠিত ডেটা সেট দেখাতে পারে, তবে এটি বিশ্বাসযোগ্য কি না, তা সহজেই বোঝা যাবে।

করভিডসের কৌশল হচ্ছে—এটি গাণিতিক সূত্র ব্যবহার করে সংখ্যার সব সম্ভাব্য সমন্বয় খুঁজে দেখে। সম্ভাব্য অনিয়ম বের করতে করভিডস সম্ভাব্য ডেটা সেটগুলোকে হিস্টোগ্রামসে রূপান্তর করে এবং ত্রিমাত্রিক চার্ট তৈরি করে। এতে যেকোনো অস্বাভাবিক গঠন দৃশ্যমান হয়। এ পদ্ধতিতে তথ্য সংগ্রহে কোনো পক্ষপাত থাকলে বা উপাত্তে জালিয়াতি থাকলে তা ধরা পড়ে।

যাঁরা একাডেমিক জার্নাল পর্যালোচনা করেন বা সম্পাদনা করেন, তাঁদের কাছে করভিডস আশীর্বাদ হয়ে আসতে পারে। তাঁদের কাছে জমা হওয়া গবেষণাপত্রের সমস্যা শুরুতেই ধরতে পারবেন। এরপর সে সমস্যার বিষয়টি লেখক বা গবেষককে জানিয়ে দিতে পারবেন। এতে প্রতিটি গবেষণার সঙ্গে যুক্ত উপাত্ত আলাদা করে গ্রহণ করে পরিসংখ্যান বের করার প্রয়োজন হবে না। কোনো অসমাধানযোগ্য সমস্যা থাকলে পদ্ধতিগত বিষয়গুলো নিয়ে কাজ করার সুযোগ তৈরি হবে।

করভিডসের কিছু দুর্বলতাও রয়েছে। কিছু ক্ষেত্রে এটি চালানোর জন্য দীর্ঘ সময় লাগতে পারে।

অবশ্য করভিডসে যে ঘাটতি আছে, তা পূরণ করতে ‘স্যাম্পল প্যারামিটার রিকনস্ট্রাকশন ভায়া ইটারেটিভ টেকনিকস’ বা ‘স্প্রাইট’ নামের আরেকটি অ্যালগরিদম রয়েছে।

যুক্তরাষ্ট্রের বস্টনে নর্থ ইস্টার্ন বিশ্ববিদ্যালয়ের জেমস হিদারস ‘পিয়ারজ প্রিপ্রিন্টস’ সাময়িকীতে স্প্রাইট সম্পর্কে বর্ণনা দেন। তাঁর মতে, স্প্রাইট হচ্ছে ‘হিউরিস্টিক সার্চ অ্যালগরিদম’। এর অর্থ হচ্ছে, এ পদ্ধতিতে সব সম্ভাব্য ফলাফল দেখাতে পারে না। তবে এর গতি দ্রুত প্রাথমিক কাজ সারতে পারে। এতে যদি কোনো অদ্ভুত ডেটা পদ্ধতি প্রদর্শিত না হয়, তবে তা বিশ্বাসযোগ্য হতে পারে।

ইকোনমিস্ট বলছে, গবেষণা নিবন্ধের ক্ষেত্রে পরিসংখ্যানের অনেক অপদ্ধতিগত প্রতিবেদন ছড়িয়ে পড়েছে। এখন অনেক সহজলভ্য সাজানো গবেষণা হচ্ছে। করভিডস ও স্প্রাইটের মতো অ্যালগরিদম আসার ফলে এ ধরনের ফাঁকিবাজি সহজে ধরা যাবে। বৈজ্ঞানিক গবেষণা নিবন্ধ বিশ্বাসযোগ্যতার ক্ষেত্রে আরও এক ধাপ এগিয়ে যাবে।

Abdus Sattar:
Good information.

sheikhabujar:
A necessary tool!

parvez.te:
Good information.

Navigation

[0] Message Index

Go to full version