Televizyon ekranında üç veri bilim öyküsü ve günümüz

Geçmiş : MindHunter

Günümüz : Person of Interest

Gelecek : Minority Report

 

FBI ajanı Holden Ford’un güncel hayatta fark ettiği bir sorunu çözme çabasını anlatan bu dizi eski bir veri bilim öyküsüdür.

Holden çözülemeyen, sebebi anlaşılamayan cinayetleri anlamak için bir araştırmaya başlar. Bu araştırma içinde tanımladığı problem ve üzerine geliştirdiği hipotezi geliştirmeye başlayan Holden, benzer özellikler gösteren katilleri incelemeye başlar. Bu incelemeleri yüz yüze görüşme yöntemi ile yapmaktadır. Holden bu görüşmeleri kayıt altına alır ve kayıt altına aldığı bu görüşmelerden katillerin ortak özelliklerini belirlemeye çalışır.

Elinde zaten işlenen suçların ayırt edici özellikleri olan Holden, elindeki bu veri setini, yaptığı bu araştırma ile katillerin özelliklerini de veri setine ekleyerek geliştirir.

Bu veri geliştirme çalışmaları sonucunda işlenen suçun özelliklerinden yola çıkarak, suçu işleyenin özelliklerini tahmin etmek en büyük amacıdır.

Bu hikayeden yola çıkarak günümüzü ele alacak olur isek, biz de işlenen suçların özelliklerinden yola çıkarak hangi suçun ne tip insanlar tarafından işlenebileceğini tahmin edebiliriz.

Bize lazım olan tek şey işlenen suçlar ve suçu işleyenlerin özellikleridir.

Yapacağımız bu araştırmayı günümüz imkanları ile ele alırsak. Yani işin içine büyük veri ve yapay zeka kavramlarını katarsak hatırlamamız gereken dizi kuşkusuz Person of Interest olacaktır.

Hatırlarsanız dizide Harold Finch büyük veri tabanlı bir yapay zeka geliştiriyor ve bu yapay zeka, işlenecek suçları ve bu suçlarla alakalı insanları tahmin ediyordu.

Geliştirilen yapay zeka, sürekli olarak erişebildiği bütün veri kaynaklarını ve insanları tarıyordu. Bu taramalar ile insanlar ve olaylar arasında ilişkiler kuran yapay zeka suç olarak sınıflandırılan olayların gelişim süreçlerini öğreniyor ve bu süreçleri farklı senaryolara göre simule ederek olması en olası olan senaryoyu tespit ediyordu. Bu tespit sonrasında yapay zeka, senaryonun anahtar kişisini tahmin ediyor ve bu tahmini Harold ile paylaşıyordu.

Haberlerden takip ettiğimiz üzere Çin’de ve İngiltere’de bu tip çalışmaların denendiğini biliyoruz. Günümüz teknolojisi ile bu tahmin süreçlerinin gerçeklenebilir olması çok kolay değil kuşkusuz. Fakat gelecek yıllar içinde bu alandaki gelişmeleri bekliyor olacağız. Belki de ülkemizde bu tip teknolojiler geliştiriyor olacağız.

Belkide Minority Report filmindeki gibi olayları olmadan çok önce tahmin edebilecek ve bize olayları olmadan önleme şansı tanıyabilecek bir teknoloji geliştirebileceğiz.

Minority Report filmini anımsayacak olur isek, film de geleceği görebilen psişik güçleri olan insanları teknoloji ile birleştirip olayları olmadan görebiliyorlar ve olaylar olmadan gerekli önlemleri alabiliyorlardı.

Kim bilir, belki de bizim kahinlerimiz de dünyayı kapsayan bir yapay zeka ağı olacaktır.

Günümüze geri dönecek olur isek,

Elimizde işlenen suçlar ve suçların nasıl işlendiği konularında bilgiler var. Ve tabi daha önce çözülen olaylarda yakalanan suçlular ve onların özellikleri var.

Şöyle düşünelim, İstanbul da bir cinayet işlenir ve kimin bu suçu işlediği bilinmemektedir. Dolayısı ile şüpheli herkes araştırılmalı. Fakat elimizde bize katilin profilini veren bir yapay zekamız olsaydı bu profilden yola çıkarak araştırmalarımızı oldukça çabuk bir şekilde yapıp olayı hızlı bir şekilde çözebilirdik. Ya da şüphelilerimizin özellikleri bir ara yüz vasıtası ile sisteme girip her birinin bu cinayeti işleyebilme olasılıklarını da hesaplaya biliriz.

Yapay zeka bu profili bize nasıl sağlayabilir?

Öncelikle suç ve suçlunun özelliklerini belirlememiz gerekiyor ve bunu çözülmüş suç dosyalarını kullanarak yapabiliriz. Tabi bu işi çok iyi bilen uzmanlar ile birlikte yapılacak uzun bir çalışma sonrasında bu özelliklerin belirlenmesi mümkün olabilir. Yani Kaggle verisi üzerinde çalışmak gidi değildir gerçek yaşam 😊 Veri bilim çalışmalarının en önemli safhası hangi verinin nasıl toplanacağının belirlenmesidir. Bu bilgiden sonra, “Veri bilim dediğiniz şeyin %80’i veri temizlemek!” diyen kaggle veri bilimcilerine de selam etmek isterim :p

Tabi bu süreçte öncelikle suçun betimlenmesi gerekir. Bu betimleme sürecinde her biri suçun sebep olduğu zarar ve içerdiği şiddet gibi özellikleri kullanılarak bir skor verilebilir(Kötülük Skoru). Ve tabi bu suçların kategorizasyonu da gerekli. Bu skorlama hangi suçun öncelikli olarak çözülmesi çalışmalarının başlayacağı gibi operasyonel süreçlerde de işe yarayacaktır kuşkusuz.

 

Suç Suçlu
Suç kategorisi Cinayet Yaş 38
Suçun işlendiği yer İstanbul Cinsiyet İstanbul
Suçun işlendiği tarih 12.02.2014 Boy 12.02.2014
. . . .
. . . .
. . . .
Kötülük skoru 70/100 Suç öncesi sabıka skoru 70/100

 

Bu gibi özellik belirleme işlemleri sonrasında artık yapay zekamızı eğitebiliriz. Tabi eğitimden kastım suç ve suçluların yapay zekaya öğretilmesi.

Bu öğrenme süreci işe yeni başlayan bir çalışma arkadaşınıza yaptığınız işi öğretmeniz gibidir. X raporu hazırlanacak ve raporun özellikleri Y1,Y2… dir. Bu rapor C1,C2,… amaçları ile hazırlanır. Bu raporu hazırlamak için D1,D2… verileri kullanılır vs…

Yeni iş arkadaşınıza hazırladığınız raporları öğrettiğinizde, ona gelebilecek bir sonraki raporu önceden öğrendiği raporlardan yola çıkarak nasıl üretebilecek ise, bizim yapay zekamızda bu öğrenme süreci sonrasında suç ve suçlu arasında bir ilişki kurabilecek ve bunu bize matematiksel olarak ifade edebilecektir.

Bu öğrenme süreci sonrasında katili bulmaya hazırız. İstanbul’da işlenen cinayetin özellikleri yapay zekaya verilir ve yapay zeka daha evvel oluşturduğu ilişki desenleri arasından en çok benzer olanı seçer ve bize profili verir. İstersek şüphelilerin özelliklerini yapay zekaya verip şuçu işleme olasılıklarını da bulabiliriz tabi.

Comments are closed.