P1010293“Genetik kod” bu gezegen üzerinde yaşayan bir “canlı” olarak bizim moleküler şifremiz. Genetik kodun anlaşılması için DNA dizilerine daha yakından bakmak gerekiyor, gerekecek. RNA üzerindeki üçlü baz dizileri ile canlıda bir fonksiyonla ilişkili proteinlerin yapıtaşları  (amino asit molekülleri) arasındaki  bağlantının çözülmesi  genetik kod kavramının doğuşuna yol açtı. Daha basit ifadeyle genetik kodu anlamlaştıran üç önemli molekül var; DNA, RNA ve protein. DNA üzerindeki bilgi RNA aracılığıyla proteine tercüme ediliyor. O zaman ilk molekül DNA olmalı diyebilirsiniz. Ancak, protein olmadan DNA’nın kendini kopyalaması olanaklı değil.  O yüzden genetik kodun nasıl oluştuğu son derece problemli bir alan.

Japon araştırıcı Kenji Ikehara bu alanda önemli çalışmaları olan bir kişi ve ortaya koyduğu  teori  “GADV-protein dünyası” adını taşıyor.  Ikehara, bu çalışmasında  evrimsel sürecin daha gerisinde olan mikrobiyal canlılardan –daha doğrusu- mikrop genlerinden yola çıkıyor. Öncelikle, bir geni tanımlamak için yapılabilecek ilk iş “Açık Okuma Çerçevesi” (Open Reading Frame) adı verilen dizilerin bulunması.  Bir ORF, başlangıç ve bitiş sinyalleri arasındaki kodonlar (1 aa kodlayan 3’lü diziler) zinciri olarak tanımlanabilir. Dolayısıyla, dizilenmiş bir genomda protein kodlayan genleri bulmanın en kolay yolu büyük ORF’ları belirlemek. Bu özellikle genleri çok az intron içeren bakteri genlerinde kolay yapılabilir.    Sonra bu ORF’ların kodon yapısı tek tek incelenir. Ikehara  yeni mikrobiyal genleri  duraksız çerçeveler (NSF: Non-Stop Frames) olarak tanımlıyor. Bunlar ayrıca guanin (G) ve sitozin (C) bazları açısından zengindir. Dolayısıyla bunlara “GC-NSF” diyor. Birde SNS tekrarlı diziler var (Burada S ; G yada C olabilir; N ise 4 bazdan biri olabilir). Bu durumda, SNS(n) ’ler,  GC-NSF lere benzer. Buradan Ikehara dünyada ilk yaşamış canlılarda genetik kodun GNC-SNS kombinasyonlarında olduğunu öne sürüyor. Neye dayanarak?

 

Mikrobiyal genlerdeki G-C içeriği %20-75 oranındadır, yani yüksektir. İlkel dünyadaki “ilksel” kod sadece belirli sayıda amino asiti (10 kadar) kodlayabiliyordu. GNC ilksel dizileri suda çözünebilir ilkel proteinleri kodlayabiliyor. Bu G-ile başlayan kodonlar  4 temel amino asiti şifreleyebilir. Bunlar  Glisin [G], Alanin [A], Aspartik asit [D] ve  Valin [V] dir. GNC-SNS tarafından üretilebilen bu 4 amino asit şu andaki proteinlere benzer olarak  ikincil ve tersiyer yapılar oluşturabiliyor.

 Burada amino asitleri şifreleyebilecek farklı DNA dizilerinin olasılıklarına bakmak yaralı olabilir. Örneğin, 100 amino asitlik bir proteini kodlayabilecek 10 130 farklı dizi olabilir. Ancak GADV  hipotezine göre, bu sayı 4100=1060 civarında. Çeşitlilik –dolayısıyla- çok daha küçük boyutta oluyor. Protein konformasyonu temel olarak sadece amino asit dizileriyle belirlendiğinden  tek-boyutlu bir genetik bilgiden bahsediyoruz. Yani bu amino asitler  birbirlerine rastgele bağlanarak dahi ilksel çorbadaki globüler proteinleri oluşturabilmişlerdir. Bu yüksek bir olasılıktır. G-C zengin bölgeler zamanla A-T mutasyon baskısıyla azalmıştır. Dolayısıyla, ilk proteinleri üreten atasal diziler G-C zengindi.   Bu fikri destekleyen kanıt P. aeruginosa bakterisinin giraz enzimini kodlayan GryA genlerindeki çalışmalardan gelmiştir. GyrA ve SpoT/RelA gibi suda-çözünür proteinler G-C zengin dizilerce kodlanmıştır ve bu genler zamanla G-C içeriği açısından fakirleşmişlerdir.

 

Ikehara’nın hipotezinde  çarpıcı olan iddia ise proteinlerin “kendini kopyalayabilmesi” ki buna –pseudo-replication adını veriyor-. Bu GADV-protein dünyası”nın ağırlıklı kabul gören  “RNA dünyası” hipotezinden  en önemli farkı. Buna göre hayatın başlangıcında proteinler bir genetik bilgiye ihtiyaç duymadan kendi kendini çoğaltabiliyordu. Bu bahsedilen  4 basit  amino asitin kombinasyonuyla mümkün olabilirdi. Daha sonra protein-RNA bağlantısı kuruldu ve genetik bilginin egemenliği  DNA’ya geçti.

Presentation1

Curr Med Chem. 2007;14(30):3221-31

Advertisements