Karcıoğlu A. A., Bulut H., Tanyolaç M. B.(Yürütücü)
Yükseköğretim Kurumları Destekli Proje, 2020 - 2022
Cicer
reticulatum kloroplast geni için NCBI sitesinden bu genin referans ver setinden
başlangıç ve bitiş indisleri belli olan bazı genler seçilmiştir. Referans veri
setinde CDS başlığı ile gen ismi belirtilmektedir. Devamında ise başlangıç ve
bitiş adresleri belirtilen bu gene ait komplement genler seçilmiştir. Bu genlerin
komplementi alınmıştır (A’nın T’ye, T’nin A’ya, C’nin G’ye, G’nin C’ye dönüştürülme
işlemi) ve komplementi alınan genler proje kapsamında elde ettiğimiz Cicer
reticulatum kloroplast geni üzerinde sezgisel bir yaklaşıma dayalı eşleştirme
yapılmıştır.
Sezgisel
yaklaşım temelde komplementi alınan genin son 10 veya ilk 10 karakterlerinin eşleştiği
indisler baz alınarak yaklaşık eşleştirme yapılmıştır. Eğer son 10 veya ilk 10
karakter tam olarak eşleşmiyorsa k-eşleşmeme (k-mismatch) sayısı 1’er
azaltılarak yaklaşık dizi eşleştirme gerçekleştirilmiştir. Buradaki temel amaç,
komplementi alınan gen bölgesini doğrudan dizi hizalama işlemine tabi tutmadan
önce yaklaşık dizi eşleştirme işlemi gerçekleştirerek olası eşleşebilecek
indisleri ortaya çıkarabilmektir. Böylelikle son k veya ilk k karakter eşleşme
sağlandığında bundan sonraki adım olan eşleşmelerin bulunduğu indisle
komplementi alınan gen bölgesinin hizalanarak yüksek skor puanı elde
edilmesinin sağlanmıştır.
Son
k adet veya ilk k adet dizi eşleşme elde edildiğinde eşleşmenin olduğu indisin
başlangıç indisine komplementi alınan genin başlangıcı hizalanarak dizi
hizalama gerçekleştirilir ve skor elde edilir. Bunlar, son k ve ilk k
karakterin eşleştiği tüm yaklaşık eşleşmelerin elde edildiği indisler için tek
tek gerçekleştirilerek dizi hizalama ve skor hesaplama işlemi gerçekleştirilir.
İlk
10 ve son 10 nükleotit eşleşmesi olmadığında 1 eksiltilerek gidilmiş ilk ve son
9-8-7… gibi olası tüm nükleotid eşleşmelerine bakılmıştır. İlk 10-9-8 nükleotit
eşleşmesi gerçekleştiği durumda eşleşmenin başladığı indis baz alınarak
complement uzunluğu kadar bir gen parçası alınmıştır. Son 10-9-8 nükleotit
eşleşmesi gerçekleştiğinde ise alınan nükleotit dizisinin son elemanı son indis
olarak alınarak geriye doğru komplement uzunluğu kadar gidilerek aranan genin
uzunluğu kadar gen parçası
elde edilmiştir.
Genin
komplementi ve yaklaşık olarak eşleşme sağlayan her bir gen blokları Clustal
Omega çoklu sekans hizalama programı ile hizalanmıştır. Hizalama sonucu
CLUSTALW formatında gösterilmiş ve eşleşen nükleotit sütunları “*” sembolü ile
belirtilmiştir. Her bir hizalama Sum of Pairs (SP) skorlama yöntemi ile
puanlandırılmıştır. SP skorlama yöntemi aşağıda detaylı bir şekilde
anlatılmıştır. Skorlama işleminde boşluk açma cezası -1, boşluk genişletme
cezası -0,5 olarak alınmış. Nükleotit eşleşmeleri ise BLOSUM62 skorlama matrisi
kullanılarak puanlandırılmıştır. Her bir genin complemti, complement indisleri,
eşleşen bölgelerdeki genlerin indisleri aşağıda detaylı bir şekilde
verilmektedir.
Çalışma kapsamında “rps12”, “pbf1” ve “rps18” genleri seçilmiştir. Bu genlerin her birinde
komplenti alınacak olan alt gen bölgeleri başlangıç ve bitiş indisleri baz
alınarak seçilmiştir. İndis uzunlukları neticesinde elde edilen her bir gen
bölgesi elde edildikten sonra komplementleri alınmıştır. Komplementi alınan her
bir gen bölgesi proje kapsamında elde ettiğimiz Cicer reticulatum kloroplast
gen veri seti üzerinde yaklaşık sekans eşleştirme işlemine tabi tutularak olası
eşleşmelerin olabileceği gen bölgeleri tespit edilmiştir. Olası eşleşmelerin
olduğu indislerin başlangıç indisine komplementi alınan genler hizalandıktan
sonra sekans hizalama işlemleri ve skor hesaplama işlemleri tüm genler için
gerçekleştirilmiştir.