आईएसएसएन: 2165- 7866
वर्किनेह तेसेमा
यह शोधपत्र अफान ओरोमो में बहु-अर्थ शब्दों के अर्थ क्लस्टरिंग को प्रस्तुत करता है। इस कार्य का मुख्य विचार संदर्भों को समूहीकृत करना है जो अर्थगत रूप से संबंधित अर्थों को खोजने का एक उपयोगी तरीका प्रदान कर रहा है। लक्ष्य शब्द के दिए गए अर्थों के समान संदर्भों को तीन पदानुक्रमित और दो विभाजनीय क्लस्टरिंग का उपयोग करके समूहीकृत किया जाता है। संबंधित अर्थों के सभी संदर्भों को क्लस्टरिंग में शामिल किया जाता है और इस प्रकार कॉर्पस में सभी संदर्भों पर प्रदर्शन किया जाता है। अंतर्निहित परिकल्पना यह है कि क्लस्टरिंग संदर्भों के बीच परिलक्षित एकता को पकड़ता है और प्रत्येक क्लस्टर संदर्भों के बीच मौजूद संभावित संबंधों को प्रकट करता है। जैसा कि प्रयोग से पता चलता है, कुल पाँच क्लस्टरों में से, EM और K-मीन्स क्लस्टर जो पदानुक्रमित (एकल क्लस्टरिंग, पूर्ण क्लस्टरिंग और औसत क्लस्टरिंग) परिणाम की तुलना में काफी अधिक सटीकता देते हैं। अफान ओरोमो के लिए, EM और K-मीन्स पदानुक्रमित क्लस्टरिंग एल्गोरिदम की तुलना में अर्थ क्लस्टरिंग की सटीकता को बढ़ाते हैं। प्रत्येक क्लस्टर एक अद्वितीय अर्थ का प्रतिनिधित्व करता है। कुछ शब्दों में पाँच अर्थों के लिए दो अर्थ होते हैं। जैसा कि परिणाम से पता चलता है कि परीक्षण सेट की औसत सटीकता 85.5% थी जो कि अप्रशिक्षित मशीन लर्निंग कार्य के साथ उत्साहजनक है। इस दृष्टिकोण का उपयोग करके, क्लस्टर की सही संख्या का पता लगाना इंद्रियों की संख्या का पता लगाने के बराबर है। प्राप्त परिणाम उत्साहजनक था, भले ही इसमें संसाधन की आवश्यकता कम हो।