आईएसएसएन: 2165- 7866
ऑस्कर मार्बन और जेवियर सेगोविया
मौजूदा डेटा माइनिंग प्रक्रिया मॉडल एक संरचित तरीके से परियोजनाओं को विकसित करने का एक या दूसरा तरीका प्रस्तावित करते हैं, प्रभावी परियोजना प्रबंधन के माध्यम से उनकी जटिलता को कम करने का प्रयास करते हैं। यह किसी भी इंजीनियरिंग वातावरण में अच्छी तरह से जाना जाता है कि प्रबंधन कार्यों में से एक जो परियोजना की समस्याओं को कम करने में मदद करता है वह व्यवस्थित परियोजना प्रलेखन है, लेकिन मौजूदा डेटा माइनिंग प्रक्रियाओं में से कुछ अपने प्रलेखन का प्रस्ताव करते हैं। इसके अलावा, ये कुछ अगले चरण के लिए इनपुट के रूप में प्रत्येक चरण में प्रलेखन तैयार करने की आवश्यकता पर टिप्पणी करते हैं, लेकिन वे यह नहीं दिखाते हैं कि यह कैसे किया जाए। दूसरी ओर, साहित्य में डेटा माइनिंग परियोजनाओं के लिए UML एक्सटेंशन के उदाहरण हैं, लेकिन वे हमेशा मॉडल कार्यान्वयन पक्ष पर ध्यान केंद्रित करते हैं और प्रक्रिया के शेष भाग को ध्यान में रखने में विफल रहते हैं। इस पत्र में, हम डेटा माइनिंग परियोजनाओं (DM-UML) के लिए UML मॉडलिंग भाषा का एक विस्तार प्रस्तुत करते हैं, जो एक मानक प्रक्रिया, अर्थात् CRISP-DM के अनुरूप एक परियोजना के लिए सभी प्रलेखन आवश्यकताओं को कवर करता है, जो व्यवसाय की समझ से लेकर परिनियोजन तक है। हम प्रस्तावित DM-UML मॉडलिंग के वास्तविक अनुप्रयोग का एक उदाहरण भी दिखाते हैं। इस दृष्टिकोण का परिणाम यह है कि, दस्तावेज तैयार करने के मानकीकृत तरीके के लाभों के अलावा, यह स्पष्ट रूप से मॉडलिंग के लिए एक बहुत ही उपयोगी और पारदर्शी उपकरण है और व्यावसायिक समझ या मॉडलिंग चरण को परियोजना के शेष भाग के साथ क्रियान्वयन तक जोड़ता है, साथ ही परियोजना में शामिल गैर-तकनीकी हितधारकों के साथ संचार को सुविधाजनक बनाने का एक तरीका भी है, जो समस्याएं डेटा माइनिंग में हमेशा एक खुला प्रश्न रही हैं।