Bu yazıda, BioNTech/Pfizer SARS-CoV-2 mRNA aşısının kaynak kodunu karakter karakter inceleyeceğiz

NOT Bu yazı, https://berthub.eu/articles/posts/reverse-engineering-source-code-of-the-biontech-pfizer-vaccine/ adresindeki yazının Türkçe çevirisidir. https://gist.github.com/ugurkoltuk/2f87d8038d4fd42f4c6ad13472966797

Hoşgeldiniz! Bu yazıda, BioNTech/Pfizer SARS-CoV-2 mRNA aşısının kaynak kodunu karakter karakter inceleyeceğiz.

Bu yazıyı anlaşılırlık ve doğruluk açısından gözden geçiren pek çok insana teşekkür ederim. Tüm hatalar yine de benim hatalarımdır ve hataları hızla bert@hubertnet.nl ya da @bert_hu_bert adreslerinden birine bildirmenizi rica ederim (Çevirmenin notu: çeviri ya da Türkçe dil hatalarını da aşağıdaki yorum bölümünü kullanarak bildirmenizi rica ederim.)

Kulağa yanlış geliyor olabilir - sonuçta aşı, kolunuzdan damarınıza enjekte edilen bir sıvı. Aşının kaynak kodu da ne demek?

Bu güzel bir soru, BNT162b2 (ve Comirnaty) olarak da bilinen BioNTech/Pfizer aşısının kaynak kodunun ufak bir parçası ile başlayalım.

BNT162b2 mRNA'sının ilk 500 karakteri
BNT162b2 mRNA'sının ilk 500 karakteri. Kaynak: Dünya Sağlık Örgütü

The BNT162b2 mRNA aşısının temelinde bu sayısal kod var. Bu kod 4284 karakter uzunluğunda olduğu için, birkaç tweete sığabilir. Aşı üretiminin en başında biri bu kodu bir DNA yazıcısına (evet DNA yazıcısına) yüklüyor, DNA yazıcısı da bu kodu gerçek DNA moleküllerine dönüştürüyor.

Bir Codex BioXp 3200 DNA yazıcısı
Bir Codex BioXp 3200 DNA yazıcısı

Bu makineden çıkan az miktarda DNA, pek çok biyolojik ve kimyasal sürecin sonunda aşı şişesinin içindeki RNA’ya dönüştürülüyor. (Daha sonra RNAdan daha ayrıntılı bahsedeceğiz) 30 mikrogramlık bir dozun içinde aslında 30 mikrogram ağırlığında RNA molekülü var. Bunun yanı sıra, mRNA’nın hücrelerimize girmesini sağlayan akıllı bir lipid (yağ) paketleme sistemi de var.

RNA, DNA’nın geçici, bir nevi çalışma anındaki izdüşümü. DNA molekülü, biyolojinin flash belleği gibidir - dayanıklı, kendi içinde yedekli ve çok güvenilirdir. Ancak bilgisayarlar gibi, bu kod da önce bir işleme uğramadan, yani daha hızlı, daha esnek ve çok daha hassas bir sisteme kopyalanmadan çalışmıyor.

Bilgisayarlar için bu sisteme RAM diyoruz, bunun biyolojideki karşılığı ise RNA. Bu benzerlik oldukça şaşırtıcı. Flash belleğin aksine, RAM’deki veriler özenle korunmadığında çabucak bozulur. Pfizer/BioNTech mRNA aşısının derin dondurucuların en derininde saklanmasını gerektiren de budur: RNA kırılgan bir çiçek gibidir.

Her RNA karakteri aşağı yukarı 0.53·10⁻²¹ gram ağırlığındadır. Bu, tek bir 30 mikrogramlık aşı dozunda 6·10¹⁶ karakter olduğu anlamına gelir. Byte cinsinden ifade edersek, bu yaklaşık 25 petabyte edecektir, ancak şunu da dile getirmekte fayda var: tüm bu 25 petabyte aynı 4284 karakterin 2000 milyar tekrarından oluşmaktadır. Yani aşının asıl bilgi içeriği bir kilobyteın hemen üzerinde. SARS-CoV-2’nın kendisi ise 7.5 kilobyte civarında.

Kısa bir ön bilgi

DNA, sayısal bir koddur. Sıfır ve birleri kullanan bilgisayarların aksine, hayat A, C, G ve U ya da T (nükleotidlerini) kullanır.

Bilgisayarlarda sıfır ve birleri, ya bir yükün varlığı ya da yokluğunu, ya akımı, ya bir manyetik geçişi, ya potansiyel farkı, ya bir sinyalin modülasyonunu ya da yansıtırlıktaki bir değişimi kullanarak saklıyoruz. Kısacası sıfır ve bir bir çeşit soyut kavram değil, aksine elektron ya da pek çok değişik fiziksel seçeneğin biri şeklinde saklanıyor.

Doğada A, C, G ve U ya da T birer molekül ve zincirler halinde DNA’nın (ya da RNA’nın) içinde saklanıyor

Bilgisayarlarda bitleri sekizerli gruplayarak bu gruba bir “byte” diyoruz. Byte, işlenen verinin tipik bir birimi oluyor.

Doğa, nükleotidleri üçerli olarak “kodon"lar halinde grupluyor ve kodon, işlemlerin tipik bir birimi. Bir kodon 6 bit bilgi saklıyor (DNA karakteri yani nükleotid başına 2 bit, bir kodon 3 karakter olduğu için de 6 bit. Bu 2⁶ = 64 farklı kodon olabileceği anlamına geliyor)

Şimdiye kadar oldukça sayısal. Şüphe ederseniz, DSÖ’nün dökümanında bu sayısal kodu kendiniz de görebilirsiniz.

Burada - bu konuyla ilgili daha fazla şey okuyabileceğiniz (İngilizce) bir kaynak (‘What is life?/Hayat nedir?’) mevcut. Bu sayfanın geri kalanını anlamanıza yardımcı olabilir. Eğer video izlemeyi tercih ederseniz, iki saatlik (İngilizce) bir video da var.

Peki ya bu kod ne yapıyor?

Aşıların amacı, bağışıklık sistemimize bir patojenle (hastalığa neden olan şey) nasıl savaşması gerektiğini hasta olmadan öğretmektir. Aşılar, geçmişten beri zayıflatılmış ya da işlevsizleştirilmiş bir virüs ve bir yardımcı maddenin (adjuvant) bağışıklık sistemimizi korkutarak çalışmaya başlatması temeline dayanır. Bu temele dayanan aşıların üretilmesi için, milyarlarca yumurta (ya da böcek) kullanılır. Bu ayrıca çok şans ve bol zaman gerektirmektedir. Bir virüsün aşısını üretmek için bazen farklı (alakasız) virüslerin de kullanıldığı olur.

Bir mRNA aşısı aynı şeyi (bağışıklık sistemimizin eğitilmesini) adeta bir lazer gibi hedefe odaklı ve güçlü bir şekilde yapar.

mRNA aşıları şöyle çalışır. Enjekte edilen aşı, SARS-CoV-2’nin ünlü “spike” proteinini ifade eden, kırılgan genetik materyali içerir. Akıllıca kimyasal yollarla, aşı bu genetik materyalin hücrelerimize girmesini sağlar.

Hücrelerimiz bunun üzerine SARS-CoV-2’nin “spike” proteinlerini büyük miktarlarda üretmeye başlarlar. Bu, bağışıklık sistemimizin tetiklenmesine sebep olur. “Spike” proteinler ve hücrelerimizin ele geçirildiğinin istihbaratıyla karşılaşan bağışıklık sistemimiz, bu proteinlerin pek çok yönü ve onların üretim süreçlerine karşı güçlü bir tepki verir.

Bu da bize %95 verimlilik sağlayan bir aşı verir.

Kaynak kod!

En baştan başlayalım, başlamak için güzel bir yer. Dünya Sağlık Örgütü bize bu yardımcı resmi veriyor:

Bu bir çeşit “içindekiler” bölümü. Biz, küçük bir şapka olarak gösterilen “cap” (başlık) ile başlayacağız.

Nasıl bir dosyanın içine makine kodunu bırakıp bilgisayarda çalıştıramıyorsak, biyolojik işletim sistemimiz de bazı başlıklara (headers) gereksinim duyar, çeşitli “bağlayıcı"ları (linker) ve “işlev çağrısı” kuralları (“calling convention”) vardır.

Aşının kodu aşağıdaki iki nükleotid ile başlar:

GA

Bunu DOS ve Windows’taki çalıştırılabilir dosyaların “MZ”, ya da UNIX scriptlerinın #! ile başlamasına benzetebiliriz. Bu iki karakter, ne hayatta ne de işletim sistemlerinde çalıştırır, ancak onlar olmadan da hiçbir şey çalışmaya başamaz. (çevirmenin notu: teşbihte hata olmaz)

mRNA’nın başlığının (‘cap’) birkaç işlevi vardır. Birincisi, kodun hücre çekirdeğinden geldiğini gösterir. Bizim aşımızda tabii ki bu kod hücre çekirdeğinden değil aşıdan geliyor. Ama hücrenin bunu bilmesine gerek yok. Başlık, kodumuzun geçerli kod olarak görünmesine yol açarak yıkımını engeller.

İlk iki GA nükleotidi kimyasal olarak da RNA’nın geri kalanından biraz farklı. Bu açıdan GA‘nın içinde bir nevi bant dışı (çevirmenin notu: out-of-band) mesaj olduğunu söyleyebiliriz.

“Çevrilmeyen 5’ bölgesi” (The “Five prime untranslated region”)

Burada bazı terimleri açıklamakta fayda var. RNA molekülleri yalnızca tek bir tarafa doğru okunabilir. Kafa karıştırıcı bir şekilde, okumanın başlandığı yere 5’ ya da “beş-üssü”(‘five-prime’) denir. Okuma 3’ ya da “üç-üssü” (three-prime) bölgesinde sona erer.

Hayat proteinlerden (ya da proteinlerden oluşan şeylerden) oluşur. Bu proteinler RNA’da tanımlanır. Bir RNA, proteine dönüştürüldüğünde bu işleme “translation” (çeviri) denir

Burada “çevrilmeyen 5’ bölgesi”’nden (untranslated region (‘UTR’)) bahsediyoruz, bu yüzden bu kısım üretilen proteinde bulunmayacak:

GAAΨAAACΨAGΨAΨΨCΨΨCΨGGΨCCCCACAGACΨCAGAGAGAACCCGCCACC

İlk sürpriz ile burada karşılaşıyoruz. Normalde RNA karakterleri A, C, G ve U’dur. RNA’da U, T olarak da bilinir. Ancak burada Ψ karakteri var, neler oluyor?

Bu aşının son derece akıllıca kısımlarından biri bu. Vücudumuz güçlü bir antivirüs sistemine (orijinal olan) sahiptir. Bu yüzden,hücrelerimiz yabancı RNA konusunda çok isteksiz davranır, ve yabancı RNAyı yok etmek için ellerinden geleni yaparlar.

Bu, aşımız için bir engel teşkil eder çünkü aşımızın bir şekilde bağışıklık sistemimizden saklanması gerekiyor. Uzun yıllar boyunca yapılan deneyler gösteriyor ki, eğer RNA’daki U yerine biraz değiştirilmiş bir başka bir molekül kullanılırsa bu RNA bağışıklık sistemimiz için önemini yitiriyor.

Bu yüzden BioNTech/Pfizer aşısındaki her U yerine Ψ ile gösterilen 1-methyl-3’-pseudouridylyl kullanılıyor. Bu çok akıllıca bir yöntem, çünkü bağışıklık sistemimiz bu Ψ’nin peşini bıraksa da, hücrelerimizin geri kalanı onu normal bir U imiş gibi kabul ediyor.

Bu hilenin bilgisayar güvenliğinde kullanıldığını da görüyoruz - bazen bir mesajın biraz bozulmuş bir hali, güvenlik duvarları ve güvenlik çözümlerinin gözünden kaçabiliyor, ancak korunması gereken sistemler yine de bu bozuk mesajı kabul edip hacklenebiliyor.

Geçmişte yapılan temel bilim araştırmalarının meyvelerini şimdi yiyoruz. Bu Ψ tekniğinin mucitleri araştırmalarının önce finanse edilmesi ve sonra kabul edilmesi için çok uğraştılar. Buna hepimiz çok müteşekkir olmalıyız ve eminim nobel ödülünü de zamanı gelince alacaklar.

Pek çok insanın sorduğu bir soru var,peki ya virüsler de bu Ψ tekniğini kullanıp bağışıklık sistemimizi yenemez mi? Kısaca söylemek gerekirse, bunun gerçekleşmesi çok zor. Virüsler, üremek için hayatın kendi devamını sağlayan mekanizmalarını kullanırlar ve 1-methyl-3’-pseudouridylyl üretimi için gerekli mekanizma doğanın kendisinde yok. mRNA aşısı insan vücudunda çabucak bozuluyor ve Ψ içeren RNA’nın, hala Ψ içerirken kendini kopyalama imkanı yok. “Hayır, mRNA aşıları DNA’nızı etkılemeyecek” (İngilizce) de bu konuda oldukça güzel bir yazı.

Şimdi, 5’ UTR’ye geri dönelim. Bu 51 karakter ne işe yarıyor? Doğadaki her şey gibi, 5’ UTR’nin de net bir işlevi yok.

Hücrelerimiz RNA’yı proteinlere çevirmesi ribozom denen bir makine sayesindedir. Ribozom, protein yazdıran üç boyutlu bir yazıcı gibidir. Bir taraftan bir RNA iplikçiğini okumaya başlar ve diğer taraftan bir amino asit zinciri üretir. Bu zincir daha sonra katlanarak bir protein olur.

Protein sentezi animasyonu

Yukarıdaki likte protein sentezinin bir animasyonunu görebilirsiniz. Animasyonda alttaki siyah şerit RNA. Yeşil rengin içinde görülen şerit oluşturulan protein. Etrafta gezen diğer şeyler ise amino asitler ve onların RNA’ya uymasını sağlayan adaptörler.

Ribozomun çalışabilmesi için RNA iplikçiğinin tam üzerine konması gerekiyor. Bu gerçekleştiğinde, ribozom RNA’nın geri kalanını okuyarak protein üretebiliyor. Buradan şunu anlayabilirsiniz ki, ribozom RNA’nın üzerine konduğu kısmını protein üretimi amacıyla okuyamıyor. UTR’nın işlevlerinden biri de bu - ribozom için RNA üzerinde bir konma alanı olmak. UTR bu başlangıcı teşkil ediyor.

Bunun dışında, UTR ayrıca “metadata”, yani RNA içindeki veri hakkında veri de içeriyor: örneğin, protein üretimi ne zaman başlasın? Ve ne kadar üretim yapılsın? gibi. Bu aşıda, bilinen UTR’ler arasında “tam olarak şimdi” anlamına en çok gelen, alpha globin geninden alınan UTR kullanılıyor. Bu genin sağlam bir şekilde çok sayıda protein ürettiğini biliyoruz. Geçtiğimiz yıllarda, bilim insanları bu UTR’yi daha da iyileştirmenin yollarını buldular (DSÖ dökümanına göre), yani aşıda kullanılan aslında tam olarak alpha globin’in UTR’si değil. Daha iyisi.

S glycoprotein sinyal peptidi

Daha önce belirtildiği gibi, aşının amacı hücrelerin bol miktarda SARS-CoV-2’nin “spike” proteinini üretmesini sağlamak. Bu noktaya kadar, aşının kaynak kodunda “metadata” ve “işlev çağrısı kuralları"nı gördük. Şimdi asıl viral protein kısmına giriyoruz.

Ancak önce hala üzerinden geçmemiz gereken bir metadata katmanı daha var. Ribozom (yukarıdaki harika animasyonda gördüğümüz gibi) proteini ürettikten sonra, bu proteinin hâlâ bir yere gitmesi gerekiyor. Gideceği yer, “S glycoprotein, sinyal peptidi"nde (genişletilmiş giriş sekansı) belirtilmiştir.

Proteinlerin başlangıcında, o proteinin bir parçası olan bir nevi bir adres etiketi vardır. Bizim proteinimizde bu sinyal peptidi proteinin hücreden endoplazmik retikulum yoluyla çıkması gerektiğini belirler. Uzay Yolu’nda bile bu kadar havalı terimler yoktur!

Bu “sinyal peptidi” çok uzun değil, ancak koduna baktığımız zaman viral RNA ve aşı RNAsı arasında bazı farklılıklar görüyoruz:

(Karşılaştırmanın daha kolay olması için, havalı Ψ’lerin yerine sıradan RNA U’lar koydum)

           3   3   3   3   3   3   3   3   3   3   3   3   3   3   3   3
Virüs:   AUG UUU GUU UUU CUU GUU UUA UUG CCA CUA GUC UCU AGU CAG UGU GUU
Aşı:     AUG UUC GUG UUC CUG GUG CUG CUG CCU CUG GUG UCC AGC CAG UGU GUG
               !   !   !   !   ! ! ! !     !   !   !   !   !            

Burada ne oluyor? RNA’ları üçlü harf gruplarına ayırmam şans eseri değil. Üç RNA karakteri bir kodon ediyor. Her kodon da belirli bir amino asidi temsil ediyor. Aşıdaki sinyal peptidi ve virüsteki sinyal peptidi, tamamen aynı amino asitlerden oluşuyor.

O halde nasıl oluyor da bu RNA’lar birbirlerinden farklı?

Toplam 4³=64 farklı kodon var, çünkü 4 RNA karakteri var ve her kodonda bu karakterlerden 3 tane var. Ancak yalnızca 20 farklı amino asit var. Bu, birden çok kodonun aynı amino asiti temsil ettiği anlamına geliyor.

Hayat, aşağıdaki neredeyse evrensel olan tabloyu kullanarak RNA kodonlarını amino asitlere eşleştirir:

RNA kodon tablosu
RNA kodon tablosu (Wikipedia)

Bu tabloda görüyoruz ki, aşı ve virüs kodundaki farklı kodonlar (UUU ve UUC) aslında eşanlamlı. Aşının RNA kodu farklı, fakat sonuçta üretilen amino asitler ve protein aynı.

Daha yakından bakarsak, genellikle aşıdaki farklılıkların kodonun yukarıda 3 ile gösterilen üçüncü sırasında olduğunu görüyoruz. Eğer evrensel kodon tablomuza bakarsak, üçüncü sıradaki harfin genellikle hangi amino asidin üretileceğini etkilemediğini görüyoruz.

Peki bu kodonlar eşanlamlı ise, neden bu değişiklikler var? Daha yakından baktığımzda, aşıdaki kodonların, biri haric, daha fazla C ve G içerdiğini görüyoruz.

Neden böyle bir şey yapılmış? Yukarıda bahsettiğimiz gibi, bağışıklık sistemimizin yabancı RNA’lara bakışı pek olumlu değil. Bağışıklık sistemince fark edilmekten kurtulmak için RNA’daki U’lar yerine zaten Ψ’ler kullanılmıştı.

Ancak şu da anlaşılıyor ki, daha fazla sayıda G ve C proteine daha verimli bir şekilde dönüştürülüyor

Aşıda da bu verim, mümkün olan her yerde karakterlerin G ve C ile yer değiştirmesi ile sağlanıyor.

Aşıdaki değişikliklerden yalnızca bir tanesinin, yani CCA yerine CCU kullanılmasının, daha fazla C ya da G kullanılmasına yol açmaması ilgimi çekti. Eğer nedenini biliyorsanız lütfen bana da söyleyin! Bazı kodonların insan genomunda diğerlerine göre daha fazla bulunduğunu zaten biliyorum, ancak bunun dönüşüm hızını fazla etkilemediğini de okudum.

Asıl “Spike” proteini

Aşı RNAsının sonraki 377 karakteri, yukarıdaki gibi bir kodon iyileştirmesi ile daha fazla C ve G’ye sahip hale getirilmiş. Yer olmadığı için tüm kodu buraya yazmayacağım, ancak özellikle istisnai bir kısmına daha yakından bakacağız. Bu kısım, aşının işe yaramasını sağlayan kısım, yani aslında hayatımızın normale dönmesini sağlayacak kısım.

                  *   *
          L   D   K   V   E   A   E   V   Q   I   D   R   L   I   T   G
Virüs:   CUU GAC AAA GUU GAG GCU GAA GUG CAA AUU GAU AGG UUG AUC ACA GGC
Aşı:     CUG GAC CCU CCU GAG GCC GAG GUG CAG AUC GAC AGA CUG AUC ACA GGC
          L   D   P   P   E   A   E   V   Q   I   D   R   L   I   T   G
           !     !!! !!        !   !       !   !   !   ! !              

Burada bildiğimiz eşanlamlı RNA değişikliklerini görüyoruz. Örneğin ilk kodonda CUU yerine CUG kullanılmış. Bu, aşıya bir G ekleyerek protein üretimini iyileştiriyor. Hem CUU hem de CUG aynı L ya da Leucine amino asidini temsil ettiğinden proteinde bir değişiklik olmuyor.

Aşıdaki “spike” proteininin tamamını bu şekilde virüsteki ile karşılaştırdığımızda bütün farkların aynı amino asidi üreten farklı kodonlar olduklarını görüyoruz… İki tanesi dışında - ve bu iki tanesini burada görüyoruz.

Yukarıdaki üçüncü ve dördüncü kodonlar, gerçek değişiklikleri temsil ediyor. K ve V amino asitleri P ya da Proline ile değiştirilmiş. K için üç harf (’!!!’) V için ise sadece iki harf (’!!’) değiştirilmiş.

Bu değişikliklerin aşının etkisini çok arttırdığını görüyoruz

Peki burada ne oluyor? Eğer gerçek bir SARS-CoV-2 virüsüne parçacığına bakacak olursanız, “spike” proteinini pek çok sivri uç olarak göreceksiniz:

SARS virüs parçacıkları
SARS virüs parçacıkları (Wikipedia)

Sivri uçlar virüsün gövdesine (’the nucleocapsid protein’) monte edilmiş haldeler. Ancak şöyle bir durum söz konusu ki, bizim aşımız yalnızca bu sivri uçları üretiyor ve üzerine monte edeceğimiz bir virüs gövdesi yok.

Şunu görüyoruz ki, değiştirilmemiş, serbest “spike” proteinleri kendi içlerine doğru çökerek farklı bir yapıya dönüşüyor. Eğer aşı bu haliyle enjekte edilirse, bağışıklık sistemimizin bir bağışıklık kazanmasına sebep olurdu… Ancak bu bağışıklık, serbest “spike” proteinlerinin çökerek dönüştüğü yapıya karşı olurdu.

Gerçek SARS-CoV-2 virüsünün “spike” proteinleri ise sivri uçlu. Aşı bu halde pek işe yaramazdı.

Peki, o halde ne yapılmalı? 2017 yılında tam olarak doğru yere yerleştirilen bir çift Proline amino asidinin, SARS-CoV-1 ve MERS S proteinlerinin kaynaşma öncesi biçimlerini bir tam virüsün parçası olmadıkları halde korumalarını sağladığı gösterildi. Bu, Proline çok sert bir amino asit olduğu için işe yarıyor. Adeta bir sabitleyici gibi, proteini bağışıklık sistemimizin görmesini istediğimiz şekilde tutuyor.

Bunu keşfeden kişiler sürekli birbirleri ile birer beşlik çakarak dolaşmalılar. Kendilerinden dayanılmaz derecede bir kendini beğenmişlik yayılmalı. Ve bunu hak ediyorlar.

Güncelleme! McLellan lab, yani Proline keşfinin arkasındaki gruplardan biri bana ulaştı. Pandemi yüzünden beşlik çakmanın azaldığını ancak yine de aşıya katkıda bulunmaktan çok memnun olduklarını söylediler. Ayrıca başka gruplar, çalışanlar ve gönüllülerin önemini de vurguladılar.

Proteinin sonu, sonraki adımlar

Eğer kaynak kodun sonuna doğru gidersek, gözümüze “spike” proteininin sonunda bazı ufak değişiklikler çarpacaktır:

          V   L   K   G   V   K   L   H   Y   T   s             
Virüs:   GUG CUC AAA GGA GUC AAA UUA CAU UAC ACA UAA
Aşı:     GUG CUG AAG GGC GUG AAA CUG CAC UAC ACA UGA UGA 
          V   L   K   G   V   K   L   H   Y   T   s   s          
               !   !   !   !     ! !   !          ! 

Proteinlerin sonunda bir “stop” kodonu bulunur. Stop kodonu burada küçük s harfi ile gösterilmiştir. Bu nazikçe proteinin burada bittiğini ifade eder. Orijinal virüs UAA stop kodonunu kullanıyor, aşı ise, sanırım her ihtimale karşı iki adet UGA stop kodonu kullanıyor.

Çevrilmeyen 3’ bölgesi

Nasıl ribozom başlangıçta bir beş-üssü bölgesine ihtiyaç duyduysa, protein kodunun sonunda da benzer bir çevrilmeyen 3’ bölgesi (3’-UTR) vardır.

3’ UTR hakkında çok şey yazılabilir, ancak burada Wikipedia’dan bir alıntı yapacağım: “çevrilmeyen 3’ bölgesi, genlerin ifadesinde, sınırlandırma, kararlılık, ihraç ve çeviri verimliliğini etkileyerek çok önemli bir rol oynar .. 3’-UTR bugünkü anlayışımıza rağmen, hala göreli olarak bir sırdır.

Bildiğimiz bir şey, belli bazı 3’-UTR’ların gen ifadesini geliştirmede çok başarılı olduğudur. DSÖ’nün dökümanına göre, BioNTech/Pfizer aşısının 3’-UTR’ı “RNA’ya kararlılığını vermek ve yüksek toplam protein ifadesini sağlamak için ayrık mRNA’nın amino-termal iyileştiricisi (AES) ve mitokondriyal kodlanmış 12S ribozomal RNA’dan alınmış”. Bu, takdire değer.

En sondaki AAAAAAAAAAAAAAAAAAAAAA

mRNAların en sonu poliadenile edilmiştir(Polyadenylation). Bu, bir sürü AAAAAAAAAAAAAAAAAAA ile biter demenin havalı bir yolu. Belli ki 2020 yılı mRNA’ya bile “yeter artık” dedirtmiş.

Bir mRNA pek çok kez yeniden kullanılabilir, ancak yeniden kullanıldıkça sondaki A’larının bazılarını kaybeder. Sondaki A’lar bittiğinde mRNA artık işlevsel değildir ve ıskartaya çıkartılır. Bu şekilde sondaki “poli(A)” (poly-A), mRNA’nin bozulmaya karşı korunması işlevini görür.

mRNA aşılarının sonunda kaç tane A olması gerektiği ile ilgili araştırmalar yapılmıştır. Açık literatürde okuduğum kadarıyla bu sayı 120 civarındadır.

The BNT162b2 aşısının sonu aşağıdaki gibidir:

                                     ****** ****
UAGCAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAGCAUAU GACUAAAAAA AAAAAAAAAA 
AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAA

Bu 30 tane A, sonra bir “10 nükleotid bağlayıcı” (GCAUAUGACU), sonra yine 70 tane A.

Bunun protein ifadesini daha da arttırmak için yapılmış olan özel bir iyileştirme olduğunu sanıyorum.

Özet

Artık BNT162b2 aşısının mRNA içeriğini tam olarak biliyoruz, ve genel olarak aşağıdakilerin varlık nedenini anlıyoruz:

  • RNA’nın sıradan bır mRNA olarak algılanmasını sağlayan başlık (CAP)
  • Bilinen başarılı ve iyileştirilmiş bir çevrilmeyen 5’ bölgesi (5’-UTR)
  • Orijinal virüsten birebir kopyalanmış, kodonları iyileştirilmiş, “spike” proteininin gitmesi gereken yere gönderen sinyal peptidi
  • Orijinal “spike” proteininin kodonlarının iyileştirilmiş ve iki amino asidinin proteinin biçimini koruması için “Proline” ile değiştirilmiş versiyonu
  • Bilinen başarılı ve iyileştirilmiş bir çevrilmeyen 3’ bölgesi (3’-UTR)
  • Açıklayamadığımız bır bağlayıcı ile biraz gizemli bir poli(A) (poly-A) kuyruk

Kodonların iyileştirilmesi, mRNA’ya pek çok G ve C eklenmesi anlamına geliyor. Bu arada U yerine Ψ (1-methyl-3’-pseudouridylyl) kullanmak da bağışıklık sistemimizden, mRNA’nın onu eğitmesini sağlayacak süre boyunca kaçabilmesini sağlıyor.

Daha fazla okuma/görüntüleme

2017 yılında DNA hakkında buradan görüntüleyebileceğiniz iki saatlik bir konuşma yaptım. Bu yazı gibi, o konuşma da bilgisayarla ilgilenen insanlara yönelik.

Ayrıca, 2001 yılından beri ‘programcılar için DNA’ adlı bir sayfayı yönetiyorum.

Ayrıca insana hayret veren bağışıklık sistemimiz ile ilgili bu giriş niteliğindeki yazı da hoşunuza gidebilir

Son olarak, blog yazılarımın bu listesinde DNA, SARS-CoV-2 ve COVID ile ilgili pek çok içerik var.