Daffodil International University

Faculty of Engineering => EEE => Topic started by: abdussatter on June 24, 2018, 04:30:32 PM

Title: এসে গেছে গবেষকদের অসততা ধরার অ্যালগরিদম
Post by: abdussatter on June 24, 2018, 04:30:32 PM
গবেষণাপত্রে নিজস্ব উপাত্তের নামে যা খুশি তা লিখে চালিয়ে দেওয়ার দিন শেষ। গবেষণাপত্রে উপস্থাপিত উপাত্তের ফাঁকফোকর পরীক্ষা ও গবেষকের অসততা ধরার পদ্ধতি চলে এসেছে। ইকোনমিস্টের এক প্রতিবেদনে বলা হয়েছে, প্রকাশিত গবেষণার ফাঁকফোকর পরীক্ষা করার উপযোগী কম্পিউটার অ্যালগরিদম তৈরি করেছেন যুক্তরাষ্ট্রের কয়েকজন গবেষক। তাঁদের তৈরি এ অ্যালগরিদম সেট জার্নাল বা সাময়িকীর সম্পাদকদের জন্য সম্ভাব্য আশীর্বাদ হয়ে উঠতে পারে।

ইকোনমিস্ট বলছে, অনেক সময় বৈজ্ঞানিক গবেষণার কাজে যেসব উপাত্ত ব্যবহার করা হয়, তা সবার জন্য উন্মুক্ত থাকে না। তখন গবেষকেদের কাছে ওই উপাত্তের উৎস সম্পর্কে জানতে চাওয়া হয়। কিন্তু অনেক সময় তা পাওয়া সম্ভব হয়ে ওঠে না। অবশ্য এখন মানসিকতার কিছু পরিবর্তন ঘটেছে। তারপরও অনেক গবেষক এখনো তাঁদের উপাত্ত উৎসের মালিকানা নিজের বলেই দাবি করে থাকেন। এসব উপাত্ত তাঁরা সংগ্রহ ও বিশ্লেষণ করে নিজেদের সিদ্ধান্তে পৌঁছেছেন বলে দাবি করে থাকেন এবং অন্য প্রতিদ্বন্দ্বীদের সঙ্গে বিনিময় করতে চান না।

গবেষকেদের এই মনোভাব ‘আত্মকেন্দ্রিক’ বলে মনে হলেও এর কারণ অজানা নয় এবং তা স্বাভাবিক বলেই মনে করা হয়। কিন্তু গবেষণার উপাত্ত নিজের বলে দাবি করার খারাপ দিকও থাকে। অনেক সময় এর মাধ্যমে গুপ্ত উদ্দেশ্য সাধন করা হতে পারে। কোনো গবেষণাপত্রে যে পরিসংখ্যান তুলে ধরা হয়, তা নির্দিষ্ট ও আকাঙ্ক্ষিত ফল অর্জনের জন্য কারসাজি করা হয়ে থাকতে পারে। অন্য অর্থে বলতে গেলে লেখক বা গবেষক প্রতারণার আশ্রয় নিতে পারেন। তিনি যদি ওই উপাত্তের প্রকৃত উৎস উন্মুক্ত করে দেন, তবে তাঁর প্রতারণার বিষয়টি সুস্পষ্ট হয়ে দাঁড়াতে পারে এবং তিনি প্রতারক হিসেবে ধরা পড়ে যেতে পারেন। তাই তিনি চান, উৎস যেন যেন গোপন থাকে।

তবে সে সুযোগ ভবিষ্যতে আর নাও থাকতে পারে। কারণ, তথ্য গোপন করা কঠিন হবে। বিশেষ করে ডেটা সেটের ক্ষেত্রে পরিচিত সীমার মধ্যে পূর্ণ সংখ্যার কোনো ডেটা সেট হলে তা আরও কঠিন হবে। যেমন মানসিক পরীক্ষার ক্ষেত্রে অনেক প্রশ্নের উত্তর। গবেষক যদি এ ধরনের ডেটা সেটের ক্ষেত্রে প্রতারণার আশ্রয় নেন, সহজেই ধরা পড়ে যাবেন।

যুক্তরাষ্ট্রের ইলিনয় বিশ্ববিদ্যালয়ের গবেষক শন উইলনার ও তাঁর সহকর্মীরা মিলে বিষয়টির একটি সমাধান বের করেছেন। তাঁরা তৈরি করেছেন বিশেষ ধরনের একটি অ্যালগরিদম। ‘সাইয়্যিভিক প্রিপ্রিন্টস’ নামের একটি গবেষণা নিবন্ধে তাঁরা বিষয়টি তুলে ধরেছেন। তাঁরা ফলাফল নির্ণায়ক যে অ্যালগরিদম তৈরি করেছেন, তার নাম দিয়েছেন ‘কমপ্লিট রিকভারি অব ভ্যালুস ইন ডায়োফ্যান্টাইন সিস্টেম বা সংক্ষেপে করভিডস।

গবেষকেরা দাবি করেছেন, কোনো গবেষণার উপাত্ত পরীক্ষার ক্ষেত্রে করভিডস কাজে লাগানো যাবে। যদি কোনো ফল দেখানোর সময় করভিডসে বৈধ ডেটা সেট দেখাতে না পারে, তবে ওই ফলাফল সুস্পষ্টভাবেই সন্দেহজনক বলে ধরতে হবে। যদি তা সুসংগঠিত ডেটা সেট দেখাতে পারে, তবে এটি বিশ্বাসযোগ্য কি না, তা সহজেই বোঝা যাবে।

করভিডসের কৌশল হচ্ছে—এটি গাণিতিক সূত্র ব্যবহার করে সংখ্যার সব সম্ভাব্য সমন্বয় খুঁজে দেখে। সম্ভাব্য অনিয়ম বের করতে করভিডস সম্ভাব্য ডেটা সেটগুলোকে হিস্টোগ্রামসে রূপান্তর করে এবং ত্রিমাত্রিক চার্ট তৈরি করে। এতে যেকোনো অস্বাভাবিক গঠন দৃশ্যমান হয়। এ পদ্ধতিতে তথ্য সংগ্রহে কোনো পক্ষপাত থাকলে বা উপাত্তে জালিয়াতি থাকলে তা ধরা পড়ে।

যাঁরা একাডেমিক জার্নাল পর্যালোচনা করেন বা সম্পাদনা করেন, তাঁদের কাছে করভিডস আশীর্বাদ হয়ে আসতে পারে। তাঁদের কাছে জমা হওয়া গবেষণাপত্রের সমস্যা শুরুতেই ধরতে পারবেন। এরপর সে সমস্যার বিষয়টি লেখক বা গবেষককে জানিয়ে দিতে পারবেন। এতে প্রতিটি গবেষণার সঙ্গে যুক্ত উপাত্ত আলাদা করে গ্রহণ করে পরিসংখ্যান বের করার প্রয়োজন হবে না। কোনো অসমাধানযোগ্য সমস্যা থাকলে পদ্ধতিগত বিষয়গুলো নিয়ে কাজ করার সুযোগ তৈরি হবে।

করভিডসের কিছু দুর্বলতাও রয়েছে। কিছু ক্ষেত্রে এটি চালানোর জন্য দীর্ঘ সময় লাগতে পারে।

অবশ্য করভিডসে যে ঘাটতি আছে, তা পূরণ করতে ‘স্যাম্পল প্যারামিটার রিকনস্ট্রাকশন ভায়া ইটারেটিভ টেকনিকস’ বা ‘স্প্রাইট’ নামের আরেকটি অ্যালগরিদম রয়েছে।

যুক্তরাষ্ট্রের বস্টনে নর্থ ইস্টার্ন বিশ্ববিদ্যালয়ের জেমস হিদারস ‘পিয়ারজ প্রিপ্রিন্টস’ সাময়িকীতে স্প্রাইট সম্পর্কে বর্ণনা দেন। তাঁর মতে, স্প্রাইট হচ্ছে ‘হিউরিস্টিক সার্চ অ্যালগরিদম’। এর অর্থ হচ্ছে, এ পদ্ধতিতে সব সম্ভাব্য ফলাফল দেখাতে পারে না। তবে এর গতি দ্রুত প্রাথমিক কাজ সারতে পারে। এতে যদি কোনো অদ্ভুত ডেটা পদ্ধতি প্রদর্শিত না হয়, তবে তা বিশ্বাসযোগ্য হতে পারে।

ইকোনমিস্ট বলছে, গবেষণা নিবন্ধের ক্ষেত্রে পরিসংখ্যানের অনেক অপদ্ধতিগত প্রতিবেদন ছড়িয়ে পড়েছে। এখন অনেক সহজলভ্য সাজানো গবেষণা হচ্ছে। করভিডস ও স্প্রাইটের মতো অ্যালগরিদম আসার ফলে এ ধরনের ফাঁকিবাজি সহজে ধরা যাবে। বৈজ্ঞানিক গবেষণা নিবন্ধ বিশ্বাসযোগ্যতার ক্ষেত্রে আরও এক ধাপ এগিয়ে যাবে।
Title: Re: এসে গেছে গবেষকদের অসততা ধরার অ্যালগরিদম
Post by: Abdus Sattar on June 25, 2018, 09:57:10 AM
Good information.
Title: Re: এসে গেছে গবেষকদের অসততা ধরার অ্যালগরিদম
Post by: sheikhabujar on June 26, 2018, 05:21:24 PM
A necessary tool!
Title: Re: এসে গেছে গবেষকদের অসততা ধরার অ্যালগরিদম
Post by: parvez.te on July 01, 2018, 11:52:39 AM
Good information.