Тим истражувачи од ETH Zurich го разви MetaGraph, револуционерна алатка која овозможува пребарување низ огромни јавни бази на податоци за ДНК и РНК за само неколку секунди, што веќе ѝ го донесе прекарот „Google for DNA“. Глобалните генетски архиви денес содржат речиси 100 петабајти податоци, што е приближно количината на сите текстуални информации на Интернет.
Класичните методи за преземање и анализа на секвенци станаа премногу бавни и премногу тешки за компјутерите, додека MetaGraph ги компресира овие податоци во индекс за пребарување кој овозможува моментално пребарување на секвенци во милиони бази. Оваа технологија може да го забрза истражувањето на патогени, гени за отпорност на антибиотици и ретки генетски нарушувања.
Секвенцирањето на ДНК веќе ја трансформираше биомедицината, овозможувајќи откривање на наследни болести, следење на туморски мутации и откривање на вируси како што е SARS-CoV-2. Сепак, континуираното проширување на јавно достапните бази на податоци како што се SRA и ENA создаде огромен проблем со обработката на податоци.
Досега, пребарувањето на одредена секвенца бараше преземање терабајти материјал, што беше бавно и скапо. MetaGraph го решава овој проблем со обезбедување моментален пристап до милиони записи, правејќи го истражувањето на геномот побрзо и посеопфатно од кога било.
MetaGraph воведува систем со „целосен текст“ за генетски секвенци: истражувачот внесува ДНК или РНК секвенца и веднаш добива информации за тоа каде се појавува во јавните бази на податоци.
Системот користи сложени математички графикони што ги прават податоците високо компресирани – до 300 пати помали од оригиналот – додека ги задржува сите релевантни информации. Овој пристап овозможува огромна скалабилност и минимално зголемување на ресурсите дури и кога количината на податоци расте.
Трошоците за пребарување се помалку од еден долар по мегабаза, што го прави MetaGraph и точен и економичен.
Благодарение на својата брзина и прецизност, MetaGraph може целосно да го промени текот на генетските истражувања. Овозможува брзо откривање на гени за отпорност на антибиотици, идентификација на бактериофаги што ги уништуваат штетните бактерии и проучување на ретки патогени.
Во иднина, би можел да се користи и за анализа на ретки генетски болести или за брзо реагирање на нови заразни закани. Повеќе од половина од јавно достапните генетски бази на податоци веќе се индексирани, а останатите ќе бидат вклучени до крајот на годината. Бидејќи алатката е со отворен код, таа е корисна и за фармацевтските компании кои имаат свои големи бази на податоци.
Истражувачите на ETH Zurich веруваат дека MetaGraph би можел да оди подалеку од границите на лабораторијата. Според д-р Андре Калес, пребарувањата на ДНК би можеле да станат дел од секојдневниот живот: на пример, да се користат за идентификување на растителни видови дома. Со претворање на огромни, сложени генетски архиви во лесно пребарувана база на податоци, MetaGraph претставува голем скок напред во биоинформатиката и им дава на научниците моќна алатка за побрзо и поефикасно истражување на „кодот на животот“ од кога било досега.
(ToI)