এসে গেছে গবেষকদের অসততা ধরার অ্যালগরিদম

Author Topic: এসে গেছে গবেষকদের অসততা ধরার অ্যালগরিদম  (Read 274 times)

Offline Fatema Tuz - Zohora

  • Sr. Member
  • ****
  • Posts: 448
  • The power of imagination makes us infinite.
    • View Profile
গবেষণাপত্রে নিজস্ব উপাত্তের নামে যা খুশি তা লিখে চালিয়ে দেওয়ার দিন শেষ। গবেষণাপত্রে উপস্থাপিত উপাত্তের ফাঁকফোকর পরীক্ষা ও গবেষকের অসততা ধরার পদ্ধতি চলে এসেছে। ইকোনমিস্টের এক প্রতিবেদনে বলা হয়েছে, প্রকাশিত গবেষণার ফাঁকফোকর পরীক্ষা করার উপযোগী কম্পিউটার অ্যালগরিদম তৈরি করেছেন যুক্তরাষ্ট্রের কয়েকজন গবেষক। তাঁদের তৈরি এ অ্যালগরিদম সেট জার্নাল বা সাময়িকীর সম্পাদকদের জন্য সম্ভাব্য আশীর্বাদ হয়ে উঠতে পারে।

ইকোনমিস্ট বলছে, অনেক সময় বৈজ্ঞানিক গবেষণার কাজে যেসব উপাত্ত ব্যবহার করা হয়, তা সবার জন্য উন্মুক্ত থাকে না। তখন গবেষকেদের কাছে ওই উপাত্তের উৎস সম্পর্কে জানতে চাওয়া হয়। কিন্তু অনেক সময় তা পাওয়া সম্ভব হয়ে ওঠে না। অবশ্য এখন মানসিকতার কিছু পরিবর্তন ঘটেছে। তারপরও অনেক গবেষক এখনো তাঁদের উপাত্ত উৎসের মালিকানা নিজের বলেই দাবি করে থাকেন। এসব উপাত্ত তাঁরা সংগ্রহ ও বিশ্লেষণ করে নিজেদের সিদ্ধান্তে পৌঁছেছেন বলে দাবি করে থাকেন এবং অন্য প্রতিদ্বন্দ্বীদের সঙ্গে বিনিময় করতে চান না।

গবেষকেদের এই মনোভাব ‘আত্মকেন্দ্রিক’ বলে মনে হলেও এর কারণ অজানা নয় এবং তা স্বাভাবিক বলেই মনে করা হয়। কিন্তু গবেষণার উপাত্ত নিজের বলে দাবি করার খারাপ দিকও থাকে। অনেক সময় এর মাধ্যমে গুপ্ত উদ্দেশ্য সাধন করা হতে পারে। কোনো গবেষণাপত্রে যে পরিসংখ্যান তুলে ধরা হয়, তা নির্দিষ্ট ও আকাঙ্ক্ষিত ফল অর্জনের জন্য কারসাজি করা হয়ে থাকতে পারে। অন্য অর্থে বলতে গেলে লেখক বা গবেষক প্রতারণার আশ্রয় নিতে পারেন। তিনি যদি ওই উপাত্তের প্রকৃত উৎস উন্মুক্ত করে দেন, তবে তাঁর প্রতারণার বিষয়টি সুস্পষ্ট হয়ে দাঁড়াতে পারে এবং তিনি প্রতারক হিসেবে ধরা পড়ে যেতে পারেন। তাই তিনি চান, উৎস যেন যেন গোপন থাকে।

তবে সে সুযোগ ভবিষ্যতে আর নাও থাকতে পারে। কারণ, তথ্য গোপন করা কঠিন হবে। বিশেষ করে ডেটা সেটের ক্ষেত্রে পরিচিত সীমার মধ্যে পূর্ণ সংখ্যার কোনো ডেটা সেট হলে তা আরও কঠিন হবে। যেমন মানসিক পরীক্ষার ক্ষেত্রে অনেক প্রশ্নের উত্তর। গবেষক যদি এ ধরনের ডেটা সেটের ক্ষেত্রে প্রতারণার আশ্রয় নেন, সহজেই ধরা পড়ে যাবেন।

যুক্তরাষ্ট্রের ইলিনয় বিশ্ববিদ্যালয়ের গবেষক শন উইলনার ও তাঁর সহকর্মীরা মিলে বিষয়টির একটি সমাধান বের করেছেন। তাঁরা তৈরি করেছেন বিশেষ ধরনের একটি অ্যালগরিদম। ‘সাইয়্যিভিক প্রিপ্রিন্টস’ নামের একটি গবেষণা নিবন্ধে তাঁরা বিষয়টি তুলে ধরেছেন। তাঁরা ফলাফল নির্ণায়ক যে অ্যালগরিদম তৈরি করেছেন, তার নাম দিয়েছেন ‘কমপ্লিট রিকভারি অব ভ্যালুস ইন ডায়োফ্যান্টাইন সিস্টেম বা সংক্ষেপে করভিডস।

গবেষকেরা দাবি করেছেন, কোনো গবেষণার উপাত্ত পরীক্ষার ক্ষেত্রে করভিডস কাজে লাগানো যাবে। যদি কোনো ফল দেখানোর সময় করভিডসে বৈধ ডেটা সেট দেখাতে না পারে, তবে ওই ফলাফল সুস্পষ্টভাবেই সন্দেহজনক বলে ধরতে হবে। যদি তা সুসংগঠিত ডেটা সেট দেখাতে পারে, তবে এটি বিশ্বাসযোগ্য কি না, তা সহজেই বোঝা যাবে।

করভিডসের কৌশল হচ্ছে—এটি গাণিতিক সূত্র ব্যবহার করে সংখ্যার সব সম্ভাব্য সমন্বয় খুঁজে দেখে। সম্ভাব্য অনিয়ম বের করতে করভিডস সম্ভাব্য ডেটা সেটগুলোকে হিস্টোগ্রামসে রূপান্তর করে এবং ত্রিমাত্রিক চার্ট তৈরি করে। এতে যেকোনো অস্বাভাবিক গঠন দৃশ্যমান হয়। এ পদ্ধতিতে তথ্য সংগ্রহে কোনো পক্ষপাত থাকলে বা উপাত্তে জালিয়াতি থাকলে তা ধরা পড়ে।

যাঁরা একাডেমিক জার্নাল পর্যালোচনা করেন বা সম্পাদনা করেন, তাঁদের কাছে করভিডস আশীর্বাদ হয়ে আসতে পারে। তাঁদের কাছে জমা হওয়া গবেষণাপত্রের সমস্যা শুরুতেই ধরতে পারবেন। এরপর সে সমস্যার বিষয়টি লেখক বা গবেষককে জানিয়ে দিতে পারবেন। এতে প্রতিটি গবেষণার সঙ্গে যুক্ত উপাত্ত আলাদা করে গ্রহণ করে পরিসংখ্যান বের করার প্রয়োজন হবে না। কোনো অসমাধানযোগ্য সমস্যা থাকলে পদ্ধতিগত বিষয়গুলো নিয়ে কাজ করার সুযোগ তৈরি হবে।

করভিডসের কিছু দুর্বলতাও রয়েছে। কিছু ক্ষেত্রে এটি চালানোর জন্য দীর্ঘ সময় লাগতে পারে।

অবশ্য করভিডসে যে ঘাটতি আছে, তা পূরণ করতে ‘স্যাম্পল প্যারামিটার রিকনস্ট্রাকশন ভায়া ইটারেটিভ টেকনিকস’ বা ‘স্প্রাইট’ নামের আরেকটি অ্যালগরিদম রয়েছে।

যুক্তরাষ্ট্রের বস্টনে নর্থ ইস্টার্ন বিশ্ববিদ্যালয়ের জেমস হিদারস ‘পিয়ারজ প্রিপ্রিন্টস’ সাময়িকীতে স্প্রাইট সম্পর্কে বর্ণনা দেন। তাঁর মতে, স্প্রাইট হচ্ছে ‘হিউরিস্টিক সার্চ অ্যালগরিদম’। এর অর্থ হচ্ছে, এ পদ্ধতিতে সব সম্ভাব্য ফলাফল দেখাতে পারে না। তবে এর গতি দ্রুত প্রাথমিক কাজ সারতে পারে। এতে যদি কোনো অদ্ভুত ডেটা পদ্ধতি প্রদর্শিত না হয়, তবে তা বিশ্বাসযোগ্য হতে পারে।

ইকোনমিস্ট বলছে, গবেষণা নিবন্ধের ক্ষেত্রে পরিসংখ্যানের অনেক অপদ্ধতিগত প্রতিবেদন ছড়িয়ে পড়েছে। এখন অনেক সহজলভ্য সাজানো গবেষণা হচ্ছে। করভিডস ও স্প্রাইটের মতো অ্যালগরিদম আসার ফলে এ ধরনের ফাঁকিবাজি সহজে ধরা যাবে। বৈজ্ঞানিক গবেষণা নিবন্ধ বিশ্বাসযোগ্যতার ক্ষেত্রে আরও এক ধাপ এগিয়ে যাবে।

Offline Mir Kaosar Ahamed

  • Sr. Member
  • ****
  • Posts: 337
  • Test
    • View Profile
Mir Kaosar Ahamed
Lecturer in Mathematics
Department of General Educational Development (GED), FSIT, DIU.

Offline afrin.ns

  • Sr. Member
  • ****
  • Posts: 423
  • Test
    • View Profile