आईएसएसएन: 2165- 7866
अब्दुल्ला बाला और एलेन अब्रान
बहु-संगठनात्मक रिपॉजिटरी, विशेष रूप से स्वैच्छिक डेटा योगदान पर आधारित जैसे कि अंतर्राष्ट्रीय सॉफ़्टवेयर बेंचमार्किंग मानक समूह (ISBSG) का रिपॉजिटरी, अपने कई डेटा फ़ील्ड के लिए बड़ी संख्या में मानों को खो सकता है, साथ ही कुछ आउटलेयर भी शामिल कर सकता है। यह पेपर ISBSG रिपॉजिटरी से जुड़े कई डेटा गुणवत्ता मुद्दों का सुझाव देता है जो बेंचमार्किंग उद्देश्यों या अनुमान मॉडल बनाने के लिए इसका उपयोग करने वाले उपयोगकर्ताओं के परिणामों से समझौता कर सकते हैं। हम विस्तृत सांख्यिकीय विश्लेषण के लिए पहचाने गए नमूनों की गुणवत्ता में सुधार करने के लिए डेटा को प्रीप्रोसेस करने के लिए कई मानदंड और तकनीकें प्रस्तावित करते हैं, और गुम मानों वाले डेटासेट से निपटने के लिए एक बहु-प्रत्यारोपण (MI) रणनीति प्रस्तुत करते हैं।