Svjetski DNK
Tehnologija

Svjetski DNK

Noah, šestogodišnji dječak iz Kanade, ima bolest kojoj nema imena. Liječnici na magnetskoj rezonanci gledaju dio mozga koji se smanjuje, nazvan mali mozak. Sumnjaju da među milijunima riječi ispisanih slovima Noinog genetskog koda postoji tipkarska greška. Stoga su dječakov DNK poslali u svijet putem interneta, nadajući se da će istu pogrešku pronaći u nekom drugom.

Kvar se može identificirati ako se ista pogreška negdje pronađe pomoću mrežnih alata. Stoga su programeri iz Toronta početkom 2016. godine počeli testirati sustav za razmjenu genetskih informacija između zdravstvenih ustanova. Mreža trenutno uključuje bolnice iz Kanade, SAD-a i Velike Britanije. Svrha sustava MatchMaker Exchange je automatizirati i globalizirati postupke usporedbe DNK. Cilj informatičara koji rade na projektu je približiti metode sekvenciranja gena suvremenim telekomunikacijskim tehnologijama. U svijetu ih ima već oko 200 XNUMX. ljudi čiji su genomi sekvencirani. Uskoro bi njihov broj mogao doseći milijune.

Sukreator kanadskog MatchMakera David Haussler, znanstvenik bioinformatike na Kalifornijskom sveučilištu, Santa Cruz, suosnivao je Global Alliance for Genomics and Health, GA2013GH, 4. s grupom drugih, koje često uspoređuje s Organizacijom za internetske standarde . W3C. Mnoge poznate ličnosti i cijele tvrtke, poput Googlea, uspjele su se pridružiti novoj organizaciji, sjemenu "Global DNK". GA4GH je predan poboljšanju protokola, razvoju programskih sučelja (API) i formata datoteka za prijenos genetskih podataka preko mreže.

Jedan od argumenata u prilog stvaranju takvog "genetskog" interneta je brzo rastuća količina podataka generiranih u laboratorijima. Najveći i najučinkovitiji centri sekvenciraju ljudske genome brzinom od dva genoma na sat (za sekvenciranje prvog čovjeka trebalo je trinaest godina). Procjenjuje se da će ove godine diljem svijeta biti proizvedeno 85 petabajta podataka. U 2019. trebalo bi ih biti duplo više. A sve to – osim ako se ne stvori globalna mreža i mogućnost pretraživanja – bit će u izoliranim, teško dostupnim bazama podataka. U takvim uvjetima nemoguće je, primjerice, testirati sve slične mutacije koje dovode do određene vrste raka, u usporedbi s lijekovima i terapijama koje se koriste. A mogućnost usporedbe u globalnoj bazi podataka bila bi izvrstan alat za kliničare. Tako je Haussler stvorio genetsku tražilicu pod nazivom Beacon koja je pretraživala dvadeset javnih DNK baza podataka i implementirala GA4GH protokole. Tražitelj može postavljati pitanja o pozicijama genetskih "slova" na pojedinačnim kromosomima genoma u bazi podataka. Unatoč prepoznavanju važnosti širokog pristupa sekvenciranoj DNK za napredak medicine, u društvu, kao i među liječnicima i istraživačima, postoji značajan otpor prema razmjeni takvih podataka. Ideja o postavljanju ljudskih genoma na Internet mnogima se čini kontroverznom. Kako bi spriječio kršenje privatnosti, GA4GH nudi peer-to-peer internetski model.

Podaci u vječnim lancima

S jedne strane, nastojimo stvoriti internet s DNK podacima - s druge strane, DNK počinje predstavljati zanimljivu alternativu računalnim zapisima podataka. Prije nekoliko mjeseci grupa švicarskih znanstvenika s Instituta za tehnologiju u Zürichu predstavila je tehniku ​​za kodiranje podataka u DNK lancima na način da se oni bez oštećenja i pogrešaka mogu pohraniti do dvije tisuće godina! Niti jedna druga poznata tehnologija snimanja ljudskih podataka ne može se mjeriti s ovom dugovječnošću. Naravno, promatrač će se odmah zapitati kako je bilo moguće dokazati dugovječnost tisućljeća u jednoj prezentaciji. Ispostavilo se da su Švicarci razvili simulaciju tako dugog razdoblja tako što su zadane DNA lančiće kapsulirali u silikonske kuglice i zagrijali ih na temperaturu od oko 72°C. Prema znanstvenicima, tjedan dana boravka na ovoj temperaturi jednak je 2. godine na 10°C. Nakon upravo takve simulacije nisu uočene greške u snimanju. Istraživači također ističu druge prednosti spirale DNK kao medija za pohranu u usporedbi s tvrdim diskovima ili magnetskim vrpcama. Na primjer, disk veličine knjige od pet terabajta može pohraniti ovu količinu podataka pod optimalnim uvjetima do pedeset godina. Unos u DNK kodu neće biti binarni, već će se temeljiti na korištenju četiri nukleotidna slova A, C, T i G. Govoreći o dostignućima Švicaraca, New Scientist je dao sljedeći izračun: jedan gram molekularne DNK lanci mogu kodirati 455 eksabajta informacija, a prema izračunima tvrtke EMC Computer 2011. godine ukupna količina prikupljenih podataka na Zemlji iznosila je 1,8 zetabajta. Jedan zetabajt jednak je 1 tisuću. Eksabajti, dakle oko 2011 grama DNK je potrebno za snimanje podataka za 4. godinu. Naravno, od 2011. obujam globalnih informacija malo se povećao i, vjerojatno, treba dodati tri grama.

genetska informatika

uspjeva Također je vrijedno zapamtiti da već postoji programski jezik za DNK. Posljednjih godina razvila ga je skupina znanstvenika sa Sveučilišta Washington u SAD-u. Pretpostavlja se da on kontrolira rad "kemijskog računala", takozvanih sustava koji se koriste za sintezu DNK. Ideja nije samo kontrolirati kemijske reakcije poput automatizacije, robota itd., već i kontrolirati doziranje lijekova. Stvaranje računalnih algoritama koji omogućuju, na primjer, prilagodbu umjetnih molekula DNK okruženju živih tkiva u kojem trebaju funkcionirati, ozbiljan je zadatak. Biološki svijet je mnogo složeniji i nepravilniji od svijeta strojeva. Međutim, teško ne znači nemoguće. “Naša ideja je stvoriti univerzalni jezik koji se može koristiti za mnoge različite zadatke”, objasnio je Georg Zelig iz tima za DNK programske jezike. Tehnologija će se s vremenom koristiti, između ostalog, za programiranje samosastavljajućih molekula u stanicama ili stvaranje biosenzora koji prate stanje tijela na staničnoj razini. Algoritam koji se koristi u sekvenciranju DNK također može pomoći u zaštiti od smeća koje preplavljuje internet, tj. neželjene pošte. Program, nazvan Chung Kwei (iz kineskog feng shui talismana koji štiti kuću od zlih duhova), učinkovit je gotovo 97 posto. Temeljio se na ranijem Tiresiasovom algoritmu (Tiresias je mitski grčki gatar) koji su razvili bioinformatičari u IBM-ovom istraživačkom centru Thomas J. Watson u New Yorku koji rade na sekvenciranju DNK. Ovaj program je tražio ponavljajuće sekvence u zapisima genetskog koda, koji obično daju važne informacije. Umjesto genoma, znanstvenici su algoritmom analizirali 65 podataka. najčešći primjeri neželjene pošte. Svaki e-mail je tretiran kao niz DNK. Uspjeli smo pronaći 6 milijuna ponavljajućih (više od jedne e-pošte) nizova slova i brojeva. Zatim je analizirana značajna količina obične korespondencije (koja se ponekad naziva šunka - "šunka" za razliku od neželjene pošte - "doručak"). Uklonjene su sekvence koje su se ponavljale u porukama šunke i neželjene pošte. Nakon toga je analizirana pristigla korespondencija. Što je veći broj tipičnih "slijeda neželjene pošte" po kilobajtu e-pošte, to je sigurnija da je neželjena pošta. Samo je jedna od 65 redovitih e-poruka greškom zaustavljena, a stopa prepoznavanja neželjene pošte dosegla je 96,56%.

Dodajte komentar