आईएसएसएन: 2379-1764
ह्यूग शानाहन, एंड्रयू हैरिसन और सीन टोबियास मे
बड़े, सार्वजनिक रूप से उपलब्ध डेटा सेट निम्न और मध्यम आय वाले देशों (एलएमआईसी) में स्थित शोधकर्ताओं के लिए एक चुनौती और अवसर प्रस्तुत करते हैं। इन शोधकर्ताओं के लिए चुनौती यह है कि वे अपनी खराब कनेक्टिविटी और बुनियादी ढांचे को देखते हुए ऐसे डेटा सेट का उपयोग कैसे कर सकते हैं। अवसर इन डेटा सेटों का उपयोग करके अग्रणी शोध करने की क्षमता है और इसलिए डेटा सेट बनाने में पर्याप्त संसाधनों का निवेश करने से बचना है। इसका परिणाम इन देशों में आने वाली महत्वपूर्ण स्थानीय समस्याओं के समाधान उत्पन्न करना और डेटा विज्ञान में एक शिक्षित कार्यबल बनाना होगा। विशेष रूप से क्लाउड कंप्यूटिंग यहाँ बुनियादी ढाँचे की कमी को पूरा कर सकती है। इस पेपर में हम चीन, नामीबिया और मलेशिया में बायोइन्फॉर्मेटिक्स में डेटा गहन विश्लेषण पर विभिन्न ग्रीष्मकालीन स्कूलों को पढ़ाने के अपने अनुभवों पर चर्चा करते हैं। इन अनुभवों के आधार पर हम प्रस्ताव करते हैं कि एलएमआईसी में डेटा विज्ञान और क्लाउड कंप्यूटिंग में ग्रीष्मकालीन स्कूलों की एक बड़ी श्रृंखला इस प्रक्रिया को शुरू करने के लिए डेटा वैज्ञानिकों का एक कैडर बनाएगी। हम अंत में क्लाउड कंप्यूटिंग संसाधनों के प्रावधान की संभावना पर चर्चा करते हैं जहाँ उपयोग लागत को नियंत्रित किया जाता है ताकि यह एलएमआईसी शोधकर्ताओं के लिए वहनीय हो।