KUANTUM BİLGİSAYARLARI VE YAPAY ZEKA

Araştırmacılar, kelime yerleştirmeleri, tekrarlayan sinir ağları ve dönüştürücüler gibi doğal dil işlemedeki temel yenilikleri kuantum alanına aktarmak için çalışıyorlar. Nihai hedef, yalnızca mevcut klasik teknikleri kuantum bilgisayarlarına aktarmak değil, aynı zamanda bu yöntemleri kuantum bilgisayarlarının benzersiz özelliklerinden tam olarak yararlanacak şekilde yeniden tasarlamaktır.

 

Bilim insanları ve şirketler sessizce ve kararlı bir şekilde 2019'dan beri Üretken Kuantum Yapay Zekâ üzerinde çalışıyorlar. Makine öğrenimi için yerel kuantum sistemleri oluşturmaya yönelik erken yönlendirmeler, dünyanın en güçlü kuantum bilgisayarlarına ve klasik olarak simüle edilemeyen kuantum bilgisayarlarına erişimi hızlandırmıştır.

ChatGPT gibi araçlar toplum üzerinde derin bir etki yaratmış olsa da, daha geniş endüstriyel ve kurumsal kullanımlarına yönelik kritik bir sınırlama açıkça ortaya çıktı. Klasik büyük dil modelleri (LLM'ler) hesaplama devleridir, aşırı derecede büyüktür ve eğitilmeleri pahalıdır ve güvenilirliklerine zarar veren hatalara eğilimlidir.

ChatGPT gibi eğitim modelleri milyarlarca, hatta trilyonlarca parametreye sahip geniş veri kümelerinin işlenmesini gerektirir. Bu, genellikle binlerce GPU (Grafik İşlemci Birimi) veya özel donanım hızlandırıcıya yayılmış muazzam bir hesaplama gücü gerektirir. Çevresel maliyet şaşırtıcıdır; örneğin, sadece GPT-3'ü eğitmek bile yaklaşık 1.300 megavat-saat elektrik gerekmekte; bu da ortalama 130 evin yıllık enerji kullanımına eşdeğerdir. Tüm bu zorluklara rağmen, daha büyük modeller geliştirme yönündeki çabaların yavaşlama belirtisi yok.

Kuantum teknolojisi daha sürdürülebilir, verimli ve yüksek performanslı çözümler sunuyor; bu çözümler, yapay zekayı temelden yeniden şekillendirecek, maliyetleri önemli ölçüde düşürecek ve ölçeklenebilirliği artıracak, aynı zamanda günümüzün klasik sistemlerinin sınırlamalarını aşacak. 

Kuantum Doğal Dil İşleme

Araştırmacılar, kelime yerleştirmeleri, tekrarlayan sinir ağları ve dönüştürücüler gibi doğal dil işlemedeki temel yenilikleri kuantum alanına aktarmak için çalışıyorlar. Nihai hedef, yalnızca mevcut klasik teknikleri kuantum bilgisayarlarına aktarmak değil, aynı zamanda bu yöntemleri kuantum bilgisayarlarının benzersiz özelliklerinden tam olarak yararlanacak şekilde yeniden tasarlamaktır.

Bu durum, kuantum sistemlerinin klasik sistemlerden temelde farklı olmasından kaynaklanmaktadır: dolanıklık ve girişim gibi kuantum fenomenlerinden yararlanma yetenekleri, nihayetinde hesaplama kurallarını değiştirir. Bu yeni modellerin kuantum mimarisine düzgün bir şekilde eşlenmesi, kuantum hesaplamanın benzersiz avantajlarından en iyi şekilde faydalanmamızı sağlayacaktır.

Bilgisayarları "konuşturmak"

Bir bilgisayara insan dilini anlamasını sağlamanın nihai sorunu, kendinizin yeni bir dil öğrenmeye çalışmaktan pek de farklı değildir; çok sayıda örnek duymalı/okumalı/konuşmalı, çok sayıda kural ve istisnalarını ezberlemeli, kelimeleri ve anlamlarını bilmelisiniz. Ancak, "beyin" bir bilgisayar olduğunda işler bundan daha da karmaşıktır. Bilgisayarlar doğal olarak kendi ana dillerini çok iyi konuşurlar, makine kodundan Python'a (Python, web uygulamaları, yazılım geliştirme, veri bilimi ve makine öğreniminde yaygın olarak kullanılan bir programlama dilidir) kadar her şeyin anlamlı bir yapısı ve kural kümesi vardır. 

Buna karşılık, "doğal" insan dili, bilgisayar dillerinin katı kurallarından çok farklıdır: deyimler gibi şeyler yapı duygusunu bozar, mizah ve şiir anlambilimle yaratıcı şekillerde oynar ve dilin kendisi de sürekli olarak evrim geçirir.

1980'lere kadar, çoğu doğal dil işleme sistemi karmaşık elle yazılmış kural kümelerine dayanıyordu. Ancak 1980'lerin sonlarından itibaren, dil işleme için makine öğrenimi algoritmalarının tanıtılmasıyla doğal dil işlemede bir devrim yaşandı. 

İlk makine öğrenimi yaklaşımları büyük ölçüde "istatistiksel" idi: büyük miktarda metin verisini analiz ederek, kalıpları ve olasılıkları belirleyebilirsiniz. Çeviride (Fransızcayı İngilizceye çevirmek gibi) kayda değer başarılar elde edildi ve web'in doğuşu, büyük verilerden öğrenme ve bunları işleme konusunda daha fazla yeniliğe yol açtı.

Birçok kişinin "modern" olarak gördüğü Doğal Dil İşleme, 2000'lerin sonlarında, genişletilmiş hesaplama gücü ve daha büyük veri kümelerinin sinir ağlarının pratik kullanımını mümkün kıldığı dönemde doğdu. Matematiksel modeller olan sinir ağları, matematiğin araçlarından, özellikle doğrusal cebir ve yüksek matematikten oluşturulur. 

O halde bir sinir ağı inşa etmek, doğrusal cebir ve yüksek matematik araçlarını kullanarak dili manipüle etmenin yollarını bulmak anlamına gelir. Bu, kelimeleri ve cümleleri vektörler ve matrisler olarak temsil etmek, bunları manipüle etmek için araçlar geliştirmek vb. anlamına gelir.

Kuantum Kelime Yerleştirmeleri

Sinirsel Doğal Dil İşleme'deki ilk büyük atılım, yaklaşık on yıl önce, Kelime Temsili için Küresel Vektörler olarak bilinen çerçeveler kullanılarak kelimelerin vektör temsillerinin geliştirilmesiyle gerçekleşti. Araştırmacılar kelimeleri gerçek değerli vektörler olarak yerleştirmek yerine (klasik durumda olduğu gibi), bunu karmaşık değerli vektörlerle çalışacak şekilde oluşturmuşlardır.

Kuantum mekaniğinde, fiziksel bir sistemin durumu, Hilbert uzayı (soyut bir vektör uzayı) adı verilen karmaşık bir vektör uzayında bulunan bir vektörle temsil edilir. Kelimeleri karmaşık vektörler olarak yerleştirerek, dili parametreli kuantum devrelerine ve nihayetinde işlemcimizdeki kübitlere eşleyebiliyoruz. Bu, yapay zeka topluluğu tarafından büyük ölçüde takdir edilmeyen ancak şimdi hızla ilgi gören önemli bir gelişmedir. Bir diğer atılım ise kuantum tekrarlayan sinir ağlarının (RNN) geliştirilmesinden geliyor. Tekrarlayan sinir ağları klasik Doğal Dil İşleme'de metin sınıflandırması ve dil modellemesi gibi görevleri ele almak için yaygın olarak kullanılıyor. 

Kuantum Transformatörleri (Dönüştürücüleri)

GPT-3 (GPT-3, “Yapay Zekâ” ile desteklenen, az miktarda metne dayalı olarak metnin geri kalanını tahmin eden bir dil modelidir. Açılımı Generative Pretrained Transformer 3-Üretken Önceden Eğitilmiş Transformatör olan GPT3, basit örnekler, özetler yapmak veya metinleri çevirmek için kullanılır) gibi modellerin arkasındaki mimari olan transformatörler, dil modelleme ve çeviri gibi görevlerde büyük paralellik ve son teknolojik performansı sağlayarak Doğal Dil İşleme'de devrim yarattı. Ancak transformatörler, kuantum bilgisayarlarının henüz aynı şekilde yapmadığı bir şey olan Grafik İşlemci Birimlerinin sağladığı paralellikten faydalanmak üzere tasarlanmıştır.

Bu, kuantum hesaplama ve yapay zekanın birleşimiyle ilgilenen araştırmacılar için gerçekten heyecan verici bir gelişme ve kuantum bilişim sektöründen gelen kuantum sistemlerini etkileyen ve kuantum hesaplamalarında hatalara yol açan istenmeyen bozulmalar olan kuantum gürültüsü içinde kaybolma tehlikesiyle karşı karşıyadır.

Kuantum Tensör Ağları

Tensör (çok boyutlu verinin simgelenebildiği geometrik bir nesne)  ağları, yüksek boyutlu verileri verimli bir şekilde temsil eden matematiksel yapılardır ve kuantum fiziğinden görüntü tanımaya kadar her şeyde uygulama alanı bulmuşlardır. Doğal Dil İşleme bağlamında, tensör ağları, kelime veya sembol dizilerini anlamlarına göre sınıflandırmanın amaçlandığı dizi sınıflandırması gibi görevleri gerçekleştirmek için kullanılabilir.

Kuantum tensör modellerinin ağaç benzeri yapısı, devre içi ölçüm ve kübitlerin yeniden kullanımı gibi mimarimize özgü belirli özelliklere inanılmaz derecede uygundur ve bu da büyük problemleri birkaç kübite sıkıştırmaya olanak tanır.

Kuantum teorisi doğası gereği tensör ağları tarafından tanımlandığından, bu, kuantum makine öğrenimi yaklaşımlarının ne kadar temelde farklı görünebileceğine dair başka bir örnektir - yine, Doğal Dil İşleme problemini tanımlamak için kullanılan tensör ağlarının, kuantum işlemcilerimizin işleyişini tanımlamak için kullanılan tensör ağlarına bir tür "sezgisel" eşlemesi vardır.

Şimdiye kadar öğrendiklerimiz

Henüz çok erken bir aşamada olsak da yapay zekayı kuantum donanımında çalıştırmanın enerji açısından daha verimli olacağına dair iyi göstergelere sahibiz. 

Yakın zamanda kuantum bilgisayarları klasik bilgisayarlarla karşılaştırmak için kullanılan bir görev olan "rastgele devre örneklemesi" konusunda çalışmalar yapılmakta. Hem çözüme ulaşma süresi hem de enerji kullanımı açısından klasik süper bilgisayarı geride bırakan kuantum bilgisayarları, karşılaştırıldığında klasik süper bilgisayarlardan 30.000 kat daha az enerji harcamakta.

Kuantum yapay zeka modelleri güç ve boyut olarak büyüdükçe enerji kullanımında da benzer bir ölçeklenme olduğunu görebiliriz: Genellikle ~100 kübit kullanmak, ~ 1018  klasik bit kullanmaktan daha verimlidir.

Şimdiye kadar elde edilen bir diğer önemli içgörü, kuantum modellerinin klasik muadillerine kıyasla eğitilmek için önemli ölçüde daha az parametre gerektirme eğiliminde olmasıdır. Klasik makine öğrenmesinde, özellikle büyük sinir ağlarında, parametre sayısı milyarlara kadar çıkabilir ve bu da muazzam hesaplama taleplerine yol açabilir. 

Kuantum modelleri ise, çok daha az sayıda parametreyle karşılaştırılabilir performans elde etmek için kuantum mekaniğinin benzersiz özelliklerini kullanır. Bu, bu modelleri çalıştırmak için gereken enerji ve hesaplama kaynaklarını önemli ölçüde azaltabilir.

Önümüzdeki Yol

Kuantum bilişim donanımı gelişmeye devam ettikçe, kuantum yapay zeka modelleri klasik sistemleri giderek daha fazla tamamlayabilir veya hatta onların yerini alabilir. Kuantum süperpozisyonu, dolanıklık ve girişimden yararlanarak, bu modeller hem hesaplama maliyetinde hem de enerji tüketiminde önemli azalma potansiyeli sunar. Daha az parametre gerektiren kuantum modelleri, yapay zekayı daha sürdürülebilir hale getirebilir ve bugün endüstrinin karşı karşıya olduğu pek çok zorlukların üstesinden gelmeyi başarabilir. Sonuçta kuantum bilişim olgunlaştıkça, yapay zeka ile entegrasyonu, yalnızca daha verimli ve performanslı olmakla kalmayıp aynı zamanda doğal dilin tüm karmaşıklıklarını da ele alabilen tamamen yeni yaklaşımların kilidini açma potansiyeline sahip olacaktır