MAKİNE ÖĞRENMESİNDE DENETİMLİ ÖĞRENME

ChatGPT fırtınası hızlanarak devam ediyor, yeni ve daha ileri versiyonları çıkıyor. Yeni versiyonları herkese açmıyorlar, ChatGPT’ye çok fazla ilgi olduğundan bir bekleme listesine alıyorlar. Bu arada ChatGPT’nin daha fazla geliştirilmesini istemeyenler de var, ulvi nedenlerden olduğunu iddia ediyorlar ama esas mesele rakiplerin kendi ürünleri ile ChatGPT arasındaki farkın daha fazla açılmasını istemediklerinden. Adamlar ChatGPT’ye 10 milyar dolar yatırmışlar kimseyi beklemezler doğal olarak. Teknolojik gelişmelerin önüne geçilemez ve bu yarışta birilerinin daha doğrusu dünyanın büyük kısmının geride kalması çok garip olmayacaktır. Şu anda tüm dünyada birçok firma ChatGPT benzeri bir ürün çıkartma derdinde, bakalım işin sonu nereye varacak.

Bilindiği gibi ChatGPT, yapay zekâ üst başlığı altında makine öğrenmesi tekniklerinden takviyeli öğrenme algoritmaları kullanılarak geliştiriliyor. Bu süreç dahilinde var olan algoritmaları kullandıkları gibi ya eski algoritmaları değiştirerek daha verimli hale getiriyorlar veya yeni yeni algoritmalar da geliştiriyorlar. Şu ana kadar ChatGPT ürününün geliştirici firması OpenAI şirketi 2 tane yeni makine öğrenmesi algoritması geliştirmiş durumda. Biz de bu yazımızda makine öğrenmesi metotlarından denetimli öğrenme konusuna değineceğiz.

Önceki yazımızda[1] da belirttiğimiz gibi denetimli öğrenme algoritmalarında makinenin öğrenmesi aşamasında etiketli veri kümeleri kullanılır. Algoritmalar ile veri kümelerindeki kalıplar tanımlanır ve bu kalıplar daha sonra yeni tahminler yapmakta kullanılır. Etiketli veri, her ikili veya daha çok veri karşılığında bir sonuç verisinin olması demektir. Algoritma etiketli verileri değerlendirip bir ilişki kalıbı çıkarır ve yeni bir tahmin yapması gerektiğinde bu kalıptan yararlanır.

Denetimli öğrenme, bir modelin girdi-çıktı çiftleri veya örnekler içeren etiketli bir veri kümesi üzerinde eğitildiği bir makine öğrenimi türüdür. Denetimli öğrenmenin amacı, görünmeyen veriler üzerinde doğru tahminler veya sınıflandırmalar yapabilmesi için modeli, girdiler ve çıktılar arasındaki ilişkiyi öğrenecek şekilde eğitmektir.

Denetimli öğrenmede, eğitim için kullanılan veri kümesi etiketlenir, yani veri kümesindeki her örneğin bilinen bir çıktısı veya kendisiyle ilişkilendirilmiş bir etiketi vardır. Model, giriş özelliklerine dayalı olarak tahminler yaparak veya kararlar alarak ve ardından tahmin hatasını veya kaybını en aza indirmek için bir optimizasyon süreci aracılığıyla parametrelerini ayarlar, böylece bir sonraki tahmin için bu etiketli verilerden de yararlanmış olur.

Temel olarak iki ana denetimli öğrenme metodu vardır:

Regresyon: Regresyonda amaç, sürekli bir çıktı veya değeri tahmin etmektir. Örneğin, bir evin fiyatını metrekare, konum, yatak odası sayısı, çevresel faktörler gibi özelliklerine göre daha önceden verilen verilere göre tahmin etmek.

Sınıflandırma: Sınıflandırmada amaç, aynı sınıf etiketlerini veya kategorilerini tahmin etmektir. Örneğin, e-postaları içeriklerine göre spam veya spam değil olarak sınıflandırmak veya hayvan resimlerini cinslerine göre olarak sınıflandırmak gibi.

Denetimli öğrenmede, etiketli veri kümesi bir eğitim seti ve bir test seti olarak ve genel olarak 80 ve 20 oranında iki kısma ayrılır. Eğitim seti, modeli eğitmek için kullanılır ve test seti, modelin performansını değerlendirmek için kullanılır. Bu, modelin görünmeyen veriler üzerinde ne kadar iyi performans göstereceğinin de değerlendirilmesine yardımcı olur. Bir örnek vermek gerekirse mesela Euro dolar paritesini tahmin edebilen bir makine öğrenmesi uygulaması yazmak için bir eğitim setinde geriye doğru en az 2 senelik veri gerekir.

Model eğitildikten sonra, performansını görmek için test seti ile mutlaka değerlendirilmesi gerekir. Regresyon değerlendirmesi için hata değerlendirme ölçütleri arasında genel mühendislik uygulamalarında da kullanılan ortalama hatanın karesi, hatanın karesinin ortalaması ve benzerleri gibi ölçütler, sınıflandırma değerlendirmesi için ise doğruluk, kesinlik ve bir veri kümesinden tüm pozitif örnekleri doğru bir şekilde tanımlama yeteneğini ölçen duyarlılık gibi değerlendirme ölçütleri kullanılır.

Denetimli öğrenmede probleme ve verilere bağlı olarak doğrusal regresyon, lojistik regresyon, karar ağaçları, destek vektör makineleri, sinir ağları gibi farklı algoritmalar veya modeller kullanılabilir. Uygun modelin seçimi, problemin karmaşıklığı, veri setinin boyutu, yorumlanabilirlik gereksinimleri ve mevcut hesaplama kaynakları gibi çeşitli faktörlere bağlıdır. Denetimli öğrenmede kullanılabilecek yüzlerce algoritma mevcut.

Bütün bu faktörlerin tek tek detaylı bir şekilde irdelenmesi ve algoritmaların bu değerlendirmelere göre seçilmesi gerekir.

Eğitim süreci sonunda modelin eğitim setinde aşırı iyi performans gösterebileceği, ancak eğitim verilerinin ezberlenmesi nedeniyle test setinde kötü performans gösterebileceği denetimli öğrenmede yaygın bir sorundur. Bu sorunu gidermek için yine bazı düzeltme teknikleri mevcuttur ve modelin aşırı uyumunu önlemek ve modelin genel performansını iyileştirmek için kullanılabilir.

Denetimli bir öğrenme modeli eğitilip değerlendirildikten sonra, yeni, görünmeyen veriler üzerinde tahminler veya sınıflandırmalar yapmak için gerçek dünya uygulamalarında denenebilir. Bu deneme, diğer yöntemlerin yanı sıra modeli bir üretim sistemine entegre etme, bir mobil uygulamaya entegre etme veya bir API aracılığı ile dış dünyaya bağlanıp gerçek veriler üstünde deneme yapma şeklinde olabilir.

Denetimli öğrenme, makine öğreniminde temel bir yaklaşımdır, görüntü tanıma, konuşma tanıma, doğal dil işleme, tahmin yürütme ve daha pek çok uygulamada sağlık, finans, pazarlama, ulaşım gibi birçok alanda başarıyla uygulanmaktadır. Ama makine öğrenmesi ile ilgili bir uygulama geliştirmek çok detaylı bir çalışma gerektirir. Bu yazıdaki her paragraf başlı başına bir dönem dersi niteliğindedir. Ciddi olarak ele alınması gerekir. Üniversitelerimiz makine öğrenmesi konusunu yapay zekâ üst başlığı altında veriyorlar, bence kesinlikle yeterli değildir, ayrı bir müfredat programı olarak ele alınması gerekir. Birleşik Arap Emirlikleri’nde yapay zekâ bakanlığının kurulduğunu hatırlayarak bu işlerde fazla da geç kalmamak gerektiğini düşünüyorum.