DNA: zoptymalizowany kod źródłowy?


Matthew Cobb 2015-11-30

Dzisiaj jest wspaniały XKCD:
Dzisiaj jest wspaniały XKCD:

 

Początkowo wysłałem tweeta z komentarzem: “Prawda. Biologia jest niemożliwa”, ponieważ ten dowcip rysunkowy podkreśla, że informacja, jaką zawiera DNA, jest znacznie bardziej skomplikowana niż to wyobraża sobie większość nie-biologów. Jest klasycznym błędem naukowców z dziedzin nauk ścisłych (szczególnie matematyków i fizyków) sądzenie, że biologia podporządkowana jest temu samemu rodzajowi ścisłych praw z jakimi obcują w ich dziedzinach – kiedy jednak studiują biologię, wkrótce zdają sobie sprawę z tego, że żywe stworzenia są znacznie bardziej złożone niż cokolwiek w fizyce lub matematyce, Jak powiedział Martin Rees, Astronom Królewski: owad jest bardziej skomplikowany niż gwiazda.


Po namyśle jednak uważam, że chociaż Patrick Munroe Randall (autor komiksu – M.K.) ma dobre serce, nadal cierpi z powodu pewnych klasycznych założeń ścisłych umysłów (był w swoim czasie robotykiem  w NASA). Pozostawiając na boku kwestię warunkowości ekspresji genów (o to może mu chodzić, kiedy pisze: „sprzężenie zwrotne i przetwarzanie zewnętrzne” na pierwszym rysunku), bohaterka wyjaśnia, że „DNA jest wynikiem najbardziej agresywnie optymalizującego procesu we wszechświecie”. Porównanie 3,8 miliarda lat „optymalizacji” DNA z kilkoma latami optymalizacji Google, powoduje, że bohater w kapeluszu dochodzi do wniosku, iż „biologia jest niemożliwa”.


To nie jest słuszne. DNA nie jest poddana „najbardziej agresywnie optymalizującemu procesowi we wszechświecie”. Nasze geny nie są doskonale przystosowane i pięknie zaprojektowane. Są okropnym, historycznym bałaganem. Po części to właśnie odróżnia biologię od fizyki i matematyki – jest rezultatem procesów historycznych – ewolucji i doboru naturalnego* - które pozostawiają ślady swojej przeszłości w genomie.


Z powodów, których nie rozumiemy, wiele genów eukariotycznych (tj., genów w organizmach z jądrem – a więc wszystkich organizmów wielokomórkowych i także niektórych jednokomórkowych) jest czasami rozdzielonych, poprzerywanych pozornie bezsensownymi sekwencjami o nazwie „introny”. Chociaż przeciętny intron ma tylko 40 zasad, jeden z intronów w ludzkim genie dystrofiny ma ponad 300 tysięcy zasad! W kilku rzadkich wypadkach intron w jednym genie może nawet zawierać cały, osobny, kodujący białko gen.


To nie jest rezultat “optymalizacji”: jest tak z powodu faktu, że – jak to ujął François Jacob –ewolucja nie projektuje, ewolucja majsterkuje. Grzebie przy tym, co jest pod ręką i chodzi tylko o to, by działało.


Wiemy, że tylko 5% ludzkiego genomu koduje białka (kiedy Francis Crick pracował nad znaczeniem kodu genetycznego w latach 1950, zakładał, że to jest wszystko, co geny kiedykolwiek robią). Wiemy obecnie, że kolejne 5-10% jest regulatorowym DNA, który produkuje RNA, który reguluje aktywność innych genów. Pozostałe 85% - około 2,7 miliarda par zasad – wydaje się głównie „śmieciami”, które nie mają żadnej ewidentnej funkcji – gdyby zostały wymazane, nie wpłynęłoby to w ogóle na sprawność organizmu.


Wiele było o to sporów, szczególnie od czasu, kiedy projekt ENCODE pokazał, że praktycznie każdy odcinek naszego DNA wydawał się produkować jakiś rodzaj reakcji chemicznej w komórce, co zdaniem badaczy z tego projektu znaczyło, że był funkcjonalny. Kiedy jednak naukowcy sztucznie stworzyli rzeczywiście losowe odcinki DNA, stwierdzili, że one także potrafią dawać reakcje chemiczne. Jeśli aktywność biochemiczna jest produkowana przez większość naszego DNA, to jest to nieodróżnialne od losowego szumu.


Pisałem o tym w książce Life’s Greatest Secret:

Różne gatunki mogą mieć genomy znacząco różniące się rozmiarami, co nie wydaje się związane z czymkolwiek w ich ekologii lub stopniu widzialnej złożoności fizjologicznej. (…) Ten problem nazywa się “paradoksem wartości C” lub “zagadką wartości C” – “C” jest ilością DNA w genomie. Niektóre z tych różnic mogą być spowodowane dobrze znanym zjawiskiem: odcinki genomu mogą duplikować się w trakcie ewolucji, szczególnie w roślinach, które potrafią podwoić rozmiary swojego genomu w jednym pokoleniu, podczas gdy duplikacja chromosomów jest nieco dezorganizująca. Z powodu takich czynników jak duplikacja zróżnicowanie wielkości genomów, jaką widzimy u gatunków, opiera się ogólnemu wyjaśnieniu opartemu na funkcji. Naświetla to żartobliwie nazwany „test cebuli”: genom cebuli zawiera około 16 miliardów par zasad, czyli pięciokrotnie więcej niż genom człowieka.

Inny przykład – wirusy potrafią wstawić się w nasz DNA, używając naszych komórek do reprodukowania siebie. Czasami pozostają i są kopiowane raz za razem. Tak więc, na przykład, pozostałości inwazyjnych sekwencji wirusowych stanowią zdumiewające 45 procent genomu człowieka, a jeden element, znany jako Alu, pozostawia ślady genetyczne, które stanowią około 10 procent naszego DNA.


To nie jest optymalizacja – to jest trwająca tysiąclecia historia infekcji!


W niektórych wypadkach majsterkując z wielkim zapałem dobór naturalny może znaleźć nowy cel dla tych wirusowych pozostałości i sądzi się, że takie sekwencje wirusowe są początkiem jednego z naszych najbardziej żywotnych narządów – łożyska.


Wreszcie, w niektórych wypadkach, przy tym zadziwiającym szumie, są także zdumiewające przykłady złożoności, która rzeczywiście wydaje się być wynikiem optymalizacji – i mogą one spowodować zawrót głowy każdego, nie tylko zawadiackiego informatyka w kapeluszu. Drosophila ma gen o nazwie Dscam, który bierze udział w rozwoju neuronalnym i ma cztery grupy eksonów (odcinków genu, które ulegają ekspresji – stąd ekson – w odróżnieniu od na pozór bezczynnych intronów).


Komórka może odczytać każdy z tych eksonów na dwanaście, czterdzieści osiem, trzydzieści trzy lub dwa alternatywne sposoby. W wyniku jeden odcinek DNA, który nazywamy Dscam, może kodować 38016 różnych białek. (Chwilowo jest to rekordowa liczba różnych białek wytwarzanych przez jeden gen. Podejrzewam, że istnieje więcej jeszcze bardziej skrajnych przypadków.)


Innymi słowy, DNA jest jeszcze bardziej skomplikowany niż wyobraża sobie Randall – jest produktem historii, jest zabałaganiony i niezaprojektowany. A kiedy czasami jest optymalizowany, stopień jego złożoności przyprawia o zawrót głowy. Biologia niezupełnie jest niemożliwa, ale jest niewiarygodnie trudna!

__________________________________________________________________

* To nie jest to samo! Ewolucja jest zmianą częstotliwości danego allelu czyli postaci genu. Wiele alleli – różnych sekwencji DNA – nie daje żadnej zmiany cechy i dlatego są one selektywnie neutralne. Mogą zmienić częstotliwość swojego występowania bez udziału doboru naturalnego.


Dobór naturalny znaczy po prostu zróżnicowane przeżywanie różnych form organizmu w gatunku. Jeśli różnice form nie mają podstawy genetycznej, to dobór naturalny nie doprowadzi do zmiany częstotliwości alleli, a więc do ewolucji. Na przykład, gdyby istniał dobór naturalny przeciwko różowym flamingom, które swój kolor zawdzięczają otoczeniu, nie zaś genom, to nie prowadziłoby to do ewolucji nowej formy w populacji (chyba, że istnieje genetyczna cecha skłaniająca flamingi do żerowania tylko na tym pokarmie, który umożliwia im przybieranie różowego koloru).


Geniusz Darwina polegał na tym, że zrozumiał, iż ewolucja drogą doboru naturalnego jest sposobem pojawiania się adaptacji. By to się zdarzyło, potrzeba zmienności w populacji, tego, by ta zmienność miała jakąś podstawę genetyczną i by prowadziło to do zróżnicowanego przeżycia. Z tym trzema czynnikami i wystarczającym czasem dojdziesz do zdumiewającej różnorodności życia, jaką mamy na planecie.


DNA: optimised source-code?

Why Evolution Is True, 18 listopada 2015

Tłumaczenie: Małgorzata Koraszewska



Matthew Cobb

Biolog i pisarz, mieszka i pracuje w Manchesterze, niedawno w Stanach Zjednoczonych ukazała się jego książka „Generation”, a w Wielkiej Brytanii „The Egg & Sperm Race”. Systematycznie publikuje w "LA Times", "Times Literary Supplement", oraz "Journal of Experimental Biology".