आईएसएसएन: 2165- 7866
एमजीबीफुलिक आईजे और क्रिस्टोफर एजिओफोर
इलेक्ट्रॉनिक रूप में दस्तावेजों की बढ़ती उपलब्धता और डेस्कटॉप प्रकाशन सॉफ्टवेयर की उपलब्धता के बावजूद, सार मैन्युअल रूप से तैयार किए जाते हैं। CONDENZA का उद्देश्य किसी दिए गए स्रोत दस्तावेज़ से सार निकालने के लिए एक प्रणाली विकसित करना है। CONDENZA सार प्राप्त करने के स्वचालित तरीकों पर एक प्रणाली का वर्णन करता है। सार का औचित्य प्रकाशित पत्रों के विषय की त्वरित और सटीक पहचान की सुविधा प्रदान करना है। विचार किसी संभावित पाठक को किसी दिए गए लेख या रिपोर्ट में उपयोगी जानकारी खोजने में समय और प्रयास बचाने का है। सिस्टम किसी दिए गए वाक्य का एक छोटा संस्करण तैयार करता है जबकि इसके अर्थ को संरक्षित करने का प्रयास करता है। यह कार्य सारांश तकनीकों का उपयोग करके किया जाता है। CONDENZA एक ऐसी विधि लागू करता है जो समान वाक्यों को एक साथ समूहीकृत करने के लिए क्लस्टरिंग आधारित दृष्टिकोण के साथ कीवर्ड आवृत्ति पहचान के लिए एप्रिओरी एल्गोरिदम को जोड़ती है। सिस्टम से परिणाम दिखाता है कि हमारा दृष्टिकोण दस्तावेज़ में शब्दों के बीच अतिरेक से बचकर पाठ दस्तावेज़ों को कुशलतापूर्वक सारांशित करने में मदद करता है और इनपुट टेक्स्ट के लिए उच्चतम प्रासंगिकता सुनिश्चित करता है। हमारे परिणामों के मार्गदर्शक कारक सारांश के बाद इनपुट से आउटपुट वाक्यों का अनुपात हैं।