Yapay Zeka Destekli Büyük Veri Analizi ve İstatistiksel Karar Destek Sistemi


Kaşali K. (Yürütücü), Özpolat Ö. F.

Teknopark, 2023 - 2025

  • Proje Türü: Teknopark
  • Başlama Tarihi: Mayıs 2023
  • Bitiş Tarihi: Haziran 2025

Proje Özeti

Yapay zeka (artifical intelligence) veya kısaca AI, işlenmemiş verilerin korelasyonu ile bilgi çıkarımı yapabilen bir tür algoritmadır. Bu algoritmalar tıpkı insanlar gibi eğitim sahibi olduğu konularda ileriye yönelik tahmin yapabilme yeteneğine sahiptir. Günümüzde yoğun olarak yapay zekanın kullanıldığı trafik navigasyon araçları ve güvenlik sistemleri hayatın kolaylaşması bağlamında dramatik bir etki faktörü olarak kendini göstermektedir. Ayrıca popüler yapay zeka uygulamalarından olan GPT4, bizlere geleceğin dünyasında yaşanabilecek değişikliklerin neler olabileceği konusunda ipuçları vermektedir. Öte yandan yaşanabilecek bu değişikliklerden fayda yerine zarar yaşanabileceği konusunda da ciddi endişleler (bkz. Geoffrey Hinton) vardır. Bu proje, ülkemizin yapay zeka tabanlı karar destek sistemleri ürünlerine bilimsel bir yaklaşım kazandırmak amacıyla, büyük verinin analiz ve çıkarım yöntemlerini istatistiksel metodlar kullanarak yapmayı hedeflemektedir.


Hedeflenen Kazanım ve Sonuçlar: Bir araştırma – geliştirme (Ar-Ge) konusu olarak yapay zekanın ele alınabilmesi için en kıymetli altyapı büyük veridir. Çünkü ister uzman sistem olsun; isterse de daha gelişmiş bir algoritma olsun, bütün yapay zeka türleri eğitime ihtiyaç duymaktadır ve yapay zekanın eğitim için en stratejik bilgi kaynağı ise etiketlenmiş (labelled) veridir. Yığma veri olarak da adlandırabileceğimiz yani herhangi bir kategoriye sahip olmayan veri setlerinin yapay zeka eğitimi için kullanılması ise genellikle kaçınılan bir çalışma alanıdır. Öte yandan günümüzün en güçlü yapay zeka uygulaması olarak sunabileceğimiz GPT4 türündeki algoritmalar ise yığma veri ile eğitilmiştir. Bu gerçeklik, adı anılan projenin temeli olarak değerlendirebileceğimiz çalışma olan “LeCun, Y., Bengio, Y., & Hinton, G.. Deep learning  (2015)” makalesinde “besleme ilerleme (feedforward)” olarak açıklanmıştır. Projemizde ise büyük verinin oluşturulması ve karar destek sistemi olarak sunulması için normal dağılımın istatistiksel yöntemlerle analiz edilmesi planlanmaktadır. Burada dikkat edilmesi gereken nokta ise büyük veriyi oluşturan kaynağın, esasında olası istatistiksel sonuçların çokluğu olmasıdır. Bir başka şekilde de ifade edecek olursak; veri setlerinin olası istatistiksel çıkarımlarının büyük veriyi oluşturulması ve ardından da doğruya en yakın sonucun kullanıcının kararı için bir destek sunması amaçlanmaktadır. Sunulan bu proje kapsamında elde edilecek ürün ile de benzer işlem yürüten ithal uygulamalara bir alternatif oluşturulması ve böylelikle ülkemiz teknolojisine dahil edilmesi ise hedeflenen kazanımdır. Sonuç olarak, projenin başarıyla tamamlanması halinde hem bir yüksek teknoloji ürününün hem de döviz cinsinden kapitalin yurt içine arzı beklenmektedir.

 

Ar-Ge Niteliği: Araştırma alanı olarak seçilen konulardan ister yapay zeka olsun, ister büyük veri ve isterse de karar destek sistemi olsun her biri bilimsel bağlamda değerlendirildiğinde ciddi bir disiplinin konusudur. Yapay zekanın bizatihi kendisinin geliştirilmesi için gerekli kaynaklar ise değerlendirilen bu proje kapsamında söz konusu edilemeyecek kadar yüksek maliyet taşmaktadır. Ancak diğer yapay zeka algoritmalarına görece daha ilkel bir tür olarak değerlendirebileceğimiz uzman sistemler de dikkate değerdir. Çünkü uzman sistemler birbiri ardınca kurallar dizisinden ibarettir ve eğitimleri ancak odaklanılan konuya has olmaktadır. Projemiz kapsamında da bu nedenle normal dağılım üzerine eğitilmiş bir uzman sistem geliştirilmesi amaçlanmaktadır. Uzman sistemin geliştirilmesinin hemen ardından, kullanıcıdan alınacak veri setlerinin istatistiksel yöntemlerle işlenmesi ise uygulamamıza büyük veriyi sunacak ve sonucunda da elde edilen bu büyük veriden kullanıcıya, seçiminde yardımcı olacak bir karar destek sistemi hedeflenmektedir. Bu kapsamda ele alındığına projenin ar-ge niteliği, temas ettiği her üç alanda da karşılanmaktadır.

 

Yenilikçi Yönü: Karar destek sistemleri kendileri birer ürün olarak piyasada bulunmaktan ziyade özelleştirilmiş bazı uygulamaların altyapısında yer almaktadır. Örneğin; bir hastane otomasyon uygulamasında doktora reçete yazma konusunda destek vermek amacıyla geliştirilebilir ve reçetede yazılan ilaçların birlikte kullanımı halinde ortaya çıkabilecek yan etkileri konusunda doktoru bilgilendirebilirler. Bu nedenle projemizin ele yenilikçi yönü ele alınırken; projenin kendisinin bir ürün olmaktan daha çok; ürünlerin altyapısında yer alabilecek bir çekirdek olarak düşünülmelidir. Normal dağılımın istatistiksel analizinden faydalanarak geliştirilen ürünler ise çoğunlukla bilimsel uygulama olarak piyasada bulunur. Örneğin; MatLab ve Origin uygulamaları kullanıcılardan aldığı veri setlerini normal dağılımın istatistiksel analizinden fayalanarak işleyen bilimsel uygulamalardır. Projemizin de öncelikle bilimsel uygulamaların yer aldığı piyasada pay sahibi olması planlanmaktadır. Ancak; çekirdek yapının navigasyon, araç güvenlik gibi sistemler için de kullanılabileceği ve arz halinde yaşanabilecek bir öncelik değişiminin projenin iş – zaman takviminde herhangi bir aksamaya neden olmaması için gerekli strateji proje ekibi tarafından düşünülmüştür. Ürünün piyasada yer alan karar destek sistemlerinin çekirdek yapısının yerli ve bağımsız yüksek teknoloji ile değiştirilmesi kapsamında ele alınması uygun olacaktır.

 

Proje Detayı: Normal dağılım, evrende doğal olarak gerçekleşen sistemlerin büyük çoğunluğunu temsil edebilecek kadar yaygın bir kapsama sahiptir. Bu kapsam, bir kum saatinin içinde oluşan tepeciğin şeklinden; yıldızların yaydığı ışık spektrumuna uzanan yelpazede kendini adeta bir kanun gibi hissetirmektedir. Gauss dağılımı olarak da sıkça adlandırılan ve özel bir matematiksel ifade ile temsil edilen bu istatistik kavramının formülasyonunun çözümü için hem cebirsel hem de yapay zeka ile parametre tespiti yapılabilmektedir. Cebirsel yaklaşımların ve yapay zeka yöntem türevlerinin teknik işleyişinden kaynaklanan farkları ise sonucun doğruluğunu dramatik biçimde etkilemektedir. Piyasada yer alan mevcut rakiplerin pazar paylarını etkileyen öncül unsurlardan birisi de kullanıcı dostu arayüzü ile birlikte kullanıcıya sunulan bu doğruluk değeridir. Proje ekibinin gerek bilimsel gerekse ticari özgeçmişleri mevcut piyasa koşullarına uygun bir prototipin geliştirilebilmesine imkan sağlamaktadır. Bilimsel çalışmaları kapsamında edindikleri istatistiksel, büyük veri analizi, yapay zeka uygulamaları ve karar destek sistemi tecrübeleri ile mevcut piyasa talebine uygun bir arz hedeflenmektedir. Öncelikle X-ışını spektrumlarının analiz edilmesi üzerine eğitilmesi planlanan bir uzman sistem, NodeJS programlama dilinde kodlanacaktır. Uygulamanın ihtiyaç duyulan arayüzleri için ise Sketch uygulaması kullanılacaktır. Verinin saklanması ve geri çağrılması içinse -güncel tarayıcılara uygun olarak-WebAPI üzerinden IndexedDB, FileStorage ve localStorage özellikleri JavaScript kullanılarak geliştirilecektir. Sunucu üzerindeki depolama servisleri için gerekli yerlerde NoSQL yapısından faydalanarak büyük veri saklanacak ve diğer süreçlerde de SQL dilini kullanan alternatif veritabanları seçilecektir.