Cicer ve Lens türlerinin kloroplast DNA dizilerinin Next Generation Sequencing ile sekanslanması ve genom organizasyonlarının belirlenerek karşılaştırmalı genom analizlerinin gerçekleştirilmesi


Karcıoğlu A. A., Bulut H., Tanyolaç M. B.(Yürütücü)

Yükseköğretim Kurumları Destekli Proje, 2020 - 2022

  • Proje Türü: Yükseköğretim Kurumları Destekli Proje
  • Başlama Tarihi: Mart 2020
  • Bitiş Tarihi: Aralık 2022

Proje Özeti

Cicer reticulatum kloroplast geni için NCBI sitesinden bu genin referans ver setinden başlangıç ve bitiş indisleri belli olan bazı genler seçilmiştir. Referans veri setinde CDS başlığı ile gen ismi belirtilmektedir. Devamında ise başlangıç ve bitiş adresleri belirtilen bu gene ait komplement genler seçilmiştir. Bu genlerin komplementi alınmıştır (A’nın T’ye, T’nin A’ya, C’nin G’ye, G’nin C’ye dönüştürülme işlemi) ve komplementi alınan genler proje kapsamında elde ettiğimiz Cicer reticulatum kloroplast geni üzerinde sezgisel bir yaklaşıma dayalı eşleştirme yapılmıştır.

Sezgisel yaklaşım temelde komplementi alınan genin son 10 veya ilk 10 karakterlerinin eşleştiği indisler baz alınarak yaklaşık eşleştirme yapılmıştır. Eğer son 10 veya ilk 10 karakter tam olarak eşleşmiyorsa k-eşleşmeme (k-mismatch) sayısı 1’er azaltılarak yaklaşık dizi eşleştirme gerçekleştirilmiştir. Buradaki temel amaç, komplementi alınan gen bölgesini doğrudan dizi hizalama işlemine tabi tutmadan önce yaklaşık dizi eşleştirme işlemi gerçekleştirerek olası eşleşebilecek indisleri ortaya çıkarabilmektir. Böylelikle son k veya ilk k karakter eşleşme sağlandığında bundan sonraki adım olan eşleşmelerin bulunduğu indisle komplementi alınan gen bölgesinin hizalanarak yüksek skor puanı elde edilmesinin sağlanmıştır.

Son k adet veya ilk k adet dizi eşleşme elde edildiğinde eşleşmenin olduğu indisin başlangıç indisine komplementi alınan genin başlangıcı hizalanarak dizi hizalama gerçekleştirilir ve skor elde edilir. Bunlar, son k ve ilk k karakterin eşleştiği tüm yaklaşık eşleşmelerin elde edildiği indisler için tek tek gerçekleştirilerek dizi hizalama ve skor hesaplama işlemi gerçekleştirilir.

İlk 10 ve son 10 nükleotit eşleşmesi olmadığında 1 eksiltilerek gidilmiş ilk ve son 9-8-7… gibi olası tüm nükleotid eşleşmelerine bakılmıştır. İlk 10-9-8 nükleotit eşleşmesi gerçekleştiği durumda eşleşmenin başladığı indis baz alınarak complement uzunluğu kadar bir gen parçası alınmıştır. Son 10-9-8 nükleotit eşleşmesi gerçekleştiğinde ise alınan nükleotit dizisinin son elemanı son indis olarak alınarak geriye doğru komplement uzunluğu kadar gidilerek aranan genin uzunluğu kadar gen parçası elde edilmiştir.

Genin komplementi ve yaklaşık olarak eşleşme sağlayan her bir gen blokları Clustal Omega çoklu sekans hizalama programı ile hizalanmıştır. Hizalama sonucu CLUSTALW formatında gösterilmiş ve eşleşen nükleotit sütunları “*” sembolü ile belirtilmiştir. Her bir hizalama Sum of Pairs (SP) skorlama yöntemi ile puanlandırılmıştır. SP skorlama yöntemi aşağıda detaylı bir şekilde anlatılmıştır. Skorlama işleminde boşluk açma cezası -1, boşluk genişletme cezası -0,5 olarak alınmış. Nükleotit eşleşmeleri ise BLOSUM62 skorlama matrisi kullanılarak puanlandırılmıştır. Her bir genin complemti, complement indisleri, eşleşen bölgelerdeki genlerin indisleri aşağıda detaylı bir şekilde verilmektedir.

Çalışma kapsamında “rps12”, “pbf1” ve “rps18” genleri seçilmiştir. Bu genlerin her birinde komplenti alınacak olan alt gen bölgeleri başlangıç ve bitiş indisleri baz alınarak seçilmiştir. İndis uzunlukları neticesinde elde edilen her bir gen bölgesi elde edildikten sonra komplementleri alınmıştır. Komplementi alınan her bir gen bölgesi proje kapsamında elde ettiğimiz Cicer reticulatum kloroplast gen veri seti üzerinde yaklaşık sekans eşleştirme işlemine tabi tutularak olası eşleşmelerin olabileceği gen bölgeleri tespit edilmiştir. Olası eşleşmelerin olduğu indislerin başlangıç indisine komplementi alınan genler hizalandıktan sonra sekans hizalama işlemleri ve skor hesaplama işlemleri tüm genler için gerçekleştirilmiştir.