आईएसएसएन: 2165- 7866
आशुतोष गुप्ता
डीऑक्सीराइबोन्यूक्लिक एसिड (डीएनए) भौतिक माध्यम का निर्माण करता है जिसमें जीवित जीवों के सभी गुण एन्कोड किए जाते हैं। इसके अनुक्रम की समझ आणविक जीव विज्ञान में प्राथमिक चिंता का विषय है। न्यूक्लियोटाइड अनुक्रम (डीएनए, आरएनए) और प्रोटीन के एमिनो-एसिड अनुक्रमों को जमा करने के लिए दुनिया भर में कुछ महत्वपूर्ण आणविक जीव विज्ञान डेटाबेस (ईआरआईबीएल, जेनबैंक, डीडीजेबी) विकसित किए गए हैं। यह अच्छी तरह से स्वीकार किया जाता है कि उनका आकार आजकल तेजी से बढ़ता है। कुछ अन्य वैज्ञानिक डेटाबेस जितना बड़ा नहीं है, उनका आकार सैकड़ों जीबी में है [1]। पूर्ण जीनोम के लिए, ये पाठ बहुत लंबे हो सकते हैं। उदाहरण के लिए मानव जीनोम में तेईस जोड़े गुणसूत्रों में तीन अरब अक्षर होते हैं। इसमें मनुष्य के सभी आनुवंशिक पदार्थ होते हैं। एक अन्य कारक जिस पर विचार किया जाना चाहिए, वह है संपीड़ित डोमेन में एक पैटर्न की खोज करके किसी विशेष प्रकार की बीमारी की भविष्यवाणी करना।