आईएसएसएन: 2165- 7866
अबेन्यू गुआडी*, देबेला टेस्फये, टेफेरी केबेबेव
यह पत्र सोशल मीडिया पर पोस्ट किए गए समाचार आइटमों के लिए अम्हारिक टेक्स्ट सारांश प्रस्तुत करता है, ट्विटर और फेसबुक पर सोशल मीडिया से पोस्ट किए गए दस्तावेज़ों के समय अम्हारिक टेक्स्ट पोस्ट किए गए समाचार आइटमों को सारांशित करने के लिए; सोशल मीडिया पर पोस्ट किए गए टेक्स्ट की मुख्य समस्या यह है कि अधिकांश लोग संभवतः पढ़ेंगे कि वे डुप्लिकेट पोस्ट किए गए दस्तावेज़ों के साथ अम्हारिक टेक्स्ट में पोस्ट किए गए हैं। हालाँकि, उपयोगकर्ता को जो जानकारी चाहिए उसे खोजने के लिए सारांश पोस्ट किए गए टेक्स्ट को खोजना होगा और सोशल मीडिया पर वांछित जानकारी निकालने के लिए अम्हारिक दस्तावेज़ों के रूप में पोस्ट के महत्वपूर्ण भागों को पढ़ना होगा। सारांशीकरण जानकारी के अधिभार से निपटना है और सारांशित करने के लिए पोस्ट किए गए दस्तावेज़ों के वर्तमान समय के प्रतिनिधित्व के लिए एक टेक्स्ट दस्तावेज़ के साथ पोस्ट करना है। हमारे प्रस्तावित दृष्टिकोण के तीन मुख्य घटक हैं: सबसे पहले, वाक्यों के दो जोड़े के भीतर प्रत्येक पोस्ट किए गए दस्तावेज़ के बीच समानता की गणना करें। दूसरा, Kmeans एल्गोरिथ्म का उपयोग करके उन्हें समूहीकृत करने के लिए दस्तावेज़ों के समानता परिणामों के आधार पर क्लस्टरिंग करना। तीसरा, TF-IDF एल्गोरिदम का उपयोग करके क्लस्टर किए गए पोस्ट किए गए दस्तावेज़ को व्यक्तिगत रूप से सारांशित करना जिसमें दस्तावेज़ों को रैंक करने के लिए बार-बार आने वाले शब्दों के लिए सांख्यिकीय तरीके खोजना शामिल है। हमने संक्षेपण तकनीक को लागू किया है जो एक निष्कर्षण संक्षेपण दृष्टिकोण है जिसे सारांश बनाने के लिए पोस्ट किए गए दस्तावेज़ों में सर्वोच्च रैंक वाले वाक्यों के साथ वाक्यों को निकालने का काम सौंपा जाता है और सारांश का आकार उपयोगकर्ता द्वारा पहचाना जा सकता है। प्रयोग एक में, विरोध पोस्ट के समूहबद्ध समूह में, 30% पर निष्कर्षण दर के लिए उच्चतम एफ-माप स्कोर 87.07% है। दूसरे प्रयोग में, सूखा पोस्ट समूहों में, 30% पर निष्कर्षण दर के लिए उच्चतम एफ-माप स्कोर 84% है। तीसरे प्रयोग में, खेल पोस्ट समूहों में, 30% पर निष्कर्षण दर के लिए उच्चतम एफ-माप स्कोर 91.37% है और चौथे प्रयोग में सारांश पोस्ट टेक्स्ट उत्पन्न करने के लिए 30% पर निष्कर्षण दर के लिए उच्चतम एफ-माप स्कोर 93.52% है।