आईएसएसएन: 2376-130X
डंकन वालेस
"बड़े डेटा" के युग में, बड़े पैमाने पर मशीन लर्निंग (ML) के माध्यम से कम्प्यूटेशनल समाधानों ने उन समस्याओं का समाधान प्रदान किया है, जिन्हें पहले संबोधित करना बहुत मुश्किल साबित होता था। हाल के वर्षों में, रोग निदान के संदर्भ में रोगी लक्षण डेटा के विश्लेषण के लिए ML दृष्टिकोणों को सफलतापूर्वक लागू किया गया है, कम से कम जहाँ ऐसा डेटा अच्छी तरह से कोडित है। हालाँकि, इलेक्ट्रॉनिक स्वास्थ्य रिकॉर्ड (EHR) में मौजूद अधिकांश डेटा क्लासिक ML दृष्टिकोणों के लिए उपयुक्त साबित होने की संभावना नहीं है। इसके अलावा, चूँकि डेटा के स्कोर अस्पतालों और व्यक्तियों दोनों में व्यापक रूप से फैले हुए हैं, इसलिए एक विकेन्द्रीकृत, कम्प्यूटेशनल रूप से स्केलेबल कार्यप्रणाली एक प्राथमिकता है। हमारा शोध उन रोगियों के एक छोटे उपखंड की प्रारंभिक पहचान पर आधारित है जो लगातार उपयोगकर्ता हैं। ये ऐसे रोगी हैं जिनकी अंतर्निहित स्थितियाँ हैं जिनके कारण उन्हें बार-बार चिकित्सा की आवश्यकता होगी। OOHC टेलीमेडिसिन और उपचार के एक तदर्थ वितरण के रूप में कार्य करता है, जहाँ संबंधित रोगी के पूर्ण चिकित्सा इतिहास का सहारा लिए बिना बातचीत होती है। ओओएचसी से संपर्क करने वाले मरीजों से संबंधित चिकित्सा इतिहास, कई अस्पतालों या शल्यचिकित्साओं में कई अलग-अलग ईएचआर प्रणालियों में रह सकते हैं, जो संबंधित ओओएचसी के लिए उपलब्ध नहीं हैं। इस प्रकार, हालांकि इस समस्या के लिए एक स्थानीय समाधान एक बेहतर विकल्प है, लेकिन यह इस प्रकार है कि जांच के तहत डेटा अधूरा, विषम है, और इसमें ज्यादातर नियमित ओओएचसी गतिविधियों के दौरान संकलित शोरगुल वाले पाठ्य नोट्स शामिल हैं। मशीन लर्निंग पद्धतियों की एक श्रृंखला के माध्यम से, इस शोध का उद्देश्य प्रारंभिक संपर्क पर रोगी मामलों की पहचान करने के साधन प्रदान करना है, जो इस तरह के आउटलेयर से संबंधित होने की संभावना है। विशेष रूप से, इन मामलों के वर्गीकरण की एक प्रणाली के विकास में गहन शिक्षण दृष्टिकोण को अपनाया गया था। इस शोध का एक और उद्देश्य सटीक शब्दों की जांच करके लगातार उपयोगकर्ता मामलों की खोज को स्पष्ट करना है जो सकारात्मक और नकारात्मक केस प्रविष्टियों का मजबूत संकेत प्रदान करते हैं।