এসে গেছে গবেষকদের অসততা ধরার অ্যালগরিদম

Author Topic: এসে গেছে গবেষকদের অসততা ধরার অ্যালগরিদম  (Read 1354 times)

Offline abdussatter

  • Sr. Member
  • ****
  • Posts: 373
  • Test
    • View Profile
গবেষণাপত্রে নিজস্ব উপাত্তের নামে যা খুশি তা লিখে চালিয়ে দেওয়ার দিন শেষ। গবেষণাপত্রে উপস্থাপিত উপাত্তের ফাঁকফোকর পরীক্ষা ও গবেষকের অসততা ধরার পদ্ধতি চলে এসেছে। ইকোনমিস্টের এক প্রতিবেদনে বলা হয়েছে, প্রকাশিত গবেষণার ফাঁকফোকর পরীক্ষা করার উপযোগী কম্পিউটার অ্যালগরিদম তৈরি করেছেন যুক্তরাষ্ট্রের কয়েকজন গবেষক। তাঁদের তৈরি এ অ্যালগরিদম সেট জার্নাল বা সাময়িকীর সম্পাদকদের জন্য সম্ভাব্য আশীর্বাদ হয়ে উঠতে পারে।

ইকোনমিস্ট বলছে, অনেক সময় বৈজ্ঞানিক গবেষণার কাজে যেসব উপাত্ত ব্যবহার করা হয়, তা সবার জন্য উন্মুক্ত থাকে না। তখন গবেষকেদের কাছে ওই উপাত্তের উৎস সম্পর্কে জানতে চাওয়া হয়। কিন্তু অনেক সময় তা পাওয়া সম্ভব হয়ে ওঠে না। অবশ্য এখন মানসিকতার কিছু পরিবর্তন ঘটেছে। তারপরও অনেক গবেষক এখনো তাঁদের উপাত্ত উৎসের মালিকানা নিজের বলেই দাবি করে থাকেন। এসব উপাত্ত তাঁরা সংগ্রহ ও বিশ্লেষণ করে নিজেদের সিদ্ধান্তে পৌঁছেছেন বলে দাবি করে থাকেন এবং অন্য প্রতিদ্বন্দ্বীদের সঙ্গে বিনিময় করতে চান না।

গবেষকেদের এই মনোভাব ‘আত্মকেন্দ্রিক’ বলে মনে হলেও এর কারণ অজানা নয় এবং তা স্বাভাবিক বলেই মনে করা হয়। কিন্তু গবেষণার উপাত্ত নিজের বলে দাবি করার খারাপ দিকও থাকে। অনেক সময় এর মাধ্যমে গুপ্ত উদ্দেশ্য সাধন করা হতে পারে। কোনো গবেষণাপত্রে যে পরিসংখ্যান তুলে ধরা হয়, তা নির্দিষ্ট ও আকাঙ্ক্ষিত ফল অর্জনের জন্য কারসাজি করা হয়ে থাকতে পারে। অন্য অর্থে বলতে গেলে লেখক বা গবেষক প্রতারণার আশ্রয় নিতে পারেন। তিনি যদি ওই উপাত্তের প্রকৃত উৎস উন্মুক্ত করে দেন, তবে তাঁর প্রতারণার বিষয়টি সুস্পষ্ট হয়ে দাঁড়াতে পারে এবং তিনি প্রতারক হিসেবে ধরা পড়ে যেতে পারেন। তাই তিনি চান, উৎস যেন যেন গোপন থাকে।

তবে সে সুযোগ ভবিষ্যতে আর নাও থাকতে পারে। কারণ, তথ্য গোপন করা কঠিন হবে। বিশেষ করে ডেটা সেটের ক্ষেত্রে পরিচিত সীমার মধ্যে পূর্ণ সংখ্যার কোনো ডেটা সেট হলে তা আরও কঠিন হবে। যেমন মানসিক পরীক্ষার ক্ষেত্রে অনেক প্রশ্নের উত্তর। গবেষক যদি এ ধরনের ডেটা সেটের ক্ষেত্রে প্রতারণার আশ্রয় নেন, সহজেই ধরা পড়ে যাবেন।

যুক্তরাষ্ট্রের ইলিনয় বিশ্ববিদ্যালয়ের গবেষক শন উইলনার ও তাঁর সহকর্মীরা মিলে বিষয়টির একটি সমাধান বের করেছেন। তাঁরা তৈরি করেছেন বিশেষ ধরনের একটি অ্যালগরিদম। ‘সাইয়্যিভিক প্রিপ্রিন্টস’ নামের একটি গবেষণা নিবন্ধে তাঁরা বিষয়টি তুলে ধরেছেন। তাঁরা ফলাফল নির্ণায়ক যে অ্যালগরিদম তৈরি করেছেন, তার নাম দিয়েছেন ‘কমপ্লিট রিকভারি অব ভ্যালুস ইন ডায়োফ্যান্টাইন সিস্টেম বা সংক্ষেপে করভিডস।

গবেষকেরা দাবি করেছেন, কোনো গবেষণার উপাত্ত পরীক্ষার ক্ষেত্রে করভিডস কাজে লাগানো যাবে। যদি কোনো ফল দেখানোর সময় করভিডসে বৈধ ডেটা সেট দেখাতে না পারে, তবে ওই ফলাফল সুস্পষ্টভাবেই সন্দেহজনক বলে ধরতে হবে। যদি তা সুসংগঠিত ডেটা সেট দেখাতে পারে, তবে এটি বিশ্বাসযোগ্য কি না, তা সহজেই বোঝা যাবে।

করভিডসের কৌশল হচ্ছে—এটি গাণিতিক সূত্র ব্যবহার করে সংখ্যার সব সম্ভাব্য সমন্বয় খুঁজে দেখে। সম্ভাব্য অনিয়ম বের করতে করভিডস সম্ভাব্য ডেটা সেটগুলোকে হিস্টোগ্রামসে রূপান্তর করে এবং ত্রিমাত্রিক চার্ট তৈরি করে। এতে যেকোনো অস্বাভাবিক গঠন দৃশ্যমান হয়। এ পদ্ধতিতে তথ্য সংগ্রহে কোনো পক্ষপাত থাকলে বা উপাত্তে জালিয়াতি থাকলে তা ধরা পড়ে।

যাঁরা একাডেমিক জার্নাল পর্যালোচনা করেন বা সম্পাদনা করেন, তাঁদের কাছে করভিডস আশীর্বাদ হয়ে আসতে পারে। তাঁদের কাছে জমা হওয়া গবেষণাপত্রের সমস্যা শুরুতেই ধরতে পারবেন। এরপর সে সমস্যার বিষয়টি লেখক বা গবেষককে জানিয়ে দিতে পারবেন। এতে প্রতিটি গবেষণার সঙ্গে যুক্ত উপাত্ত আলাদা করে গ্রহণ করে পরিসংখ্যান বের করার প্রয়োজন হবে না। কোনো অসমাধানযোগ্য সমস্যা থাকলে পদ্ধতিগত বিষয়গুলো নিয়ে কাজ করার সুযোগ তৈরি হবে।

করভিডসের কিছু দুর্বলতাও রয়েছে। কিছু ক্ষেত্রে এটি চালানোর জন্য দীর্ঘ সময় লাগতে পারে।

অবশ্য করভিডসে যে ঘাটতি আছে, তা পূরণ করতে ‘স্যাম্পল প্যারামিটার রিকনস্ট্রাকশন ভায়া ইটারেটিভ টেকনিকস’ বা ‘স্প্রাইট’ নামের আরেকটি অ্যালগরিদম রয়েছে।

যুক্তরাষ্ট্রের বস্টনে নর্থ ইস্টার্ন বিশ্ববিদ্যালয়ের জেমস হিদারস ‘পিয়ারজ প্রিপ্রিন্টস’ সাময়িকীতে স্প্রাইট সম্পর্কে বর্ণনা দেন। তাঁর মতে, স্প্রাইট হচ্ছে ‘হিউরিস্টিক সার্চ অ্যালগরিদম’। এর অর্থ হচ্ছে, এ পদ্ধতিতে সব সম্ভাব্য ফলাফল দেখাতে পারে না। তবে এর গতি দ্রুত প্রাথমিক কাজ সারতে পারে। এতে যদি কোনো অদ্ভুত ডেটা পদ্ধতি প্রদর্শিত না হয়, তবে তা বিশ্বাসযোগ্য হতে পারে।

ইকোনমিস্ট বলছে, গবেষণা নিবন্ধের ক্ষেত্রে পরিসংখ্যানের অনেক অপদ্ধতিগত প্রতিবেদন ছড়িয়ে পড়েছে। এখন অনেক সহজলভ্য সাজানো গবেষণা হচ্ছে। করভিডস ও স্প্রাইটের মতো অ্যালগরিদম আসার ফলে এ ধরনের ফাঁকিবাজি সহজে ধরা যাবে। বৈজ্ঞানিক গবেষণা নিবন্ধ বিশ্বাসযোগ্যতার ক্ষেত্রে আরও এক ধাপ এগিয়ে যাবে।
(Md. Dara Abdus Satter)
Assistant Professor, EEE
Mobile: 01716795779,
Phone: 02-9138234 (EXT-285)
Room # 610

Offline Abdus Sattar

  • Sr. Member
  • ****
  • Posts: 483
  • Only the brave teach.
    • View Profile
    • https://sites.google.com/diu.edu.bd/abdussattar/
Abdus Sattar
Assistant Professor
Department of CSE
Daffodil International University(DIU)
Mobile: 01818392800
Email: abdus.cse@diu.edu.bd
Personal Site: https://sites.google.com/diu.edu.bd/abdussattar/
Google Scholar: https://scholar.google.com/citations?user=DL9nSW4AAAAJ&hl=en

Offline sheikhabujar

  • Sr. Member
  • ****
  • Posts: 273
  • Life is Coding !
    • View Profile
    • Sheikh Abujar Personal Profile
Sheikh Abujar
Lecturer, Department of CSE
Daffodil International University
Cell: +8801673566566
Email: sheikh.cse@diu.edu.bd
Site: http://www.sheikhabujar.ml

Offline parvez.te

  • Sr. Member
  • ****
  • Posts: 335
  • Nothing is impossible...
    • View Profile
Manik Parvez