
Kaliforniya Üniversitesi'nden araştırmacılar, yapay zekâ sohbet robotlarının insan benzeri davranış sergileyip sergileyemeyeceğini anlamak için yeni bir Turing testi deneyi gerçekleştirdi. Deneyde en dikkat çeken sonuç ise OpenAI’ın geliştirdiği GPT-4.5 modelinin, katılımcıların %73’ü tarafından insan zannedilerek testten geçmesi oldu.
Turing testi: bir zekâ göstergesi mi, yoksa sadece bir taklit oyunu mu?
Alan Turing’in 1950 yılında ortaya attığı test, bir yapay zekânın insan gibi düşünüp düşünemeyeceğini anlamaya yönelik klasik bir yöntem. Bu testte, bir insan sorgulayıcı, biri insan diğeri yapay zekâ olan iki farklı muhatapla iletişim kurarak hangisinin insan olduğunu tahmin etmeye çalışıyor. Eğer bu ayrım başarıyla yapılamazsa, yapay zekâ testi geçmiş sayılıyor.
Deneyde neler oldu?
Mart 2025’te yapılan deneyde dört farklı büyük dil modeli test edildi: ELIZA, GPT-4o, LLaMa-3.1-405B ve GPT-4.5. Katılımcılar, her biriyle beş dakikalık yazışmalar yaptı.
Özellikle GPT-4.5’in sonuçları, modelin ikna kabiliyetinin oldukça güçlü olduğunu gösteriyor.
Ancak bu “zekâ” mı?
Uzmanlara göre GPT-4.5’in testi geçmesi, onun insan zekâsına sahip olduğu anlamına gelmiyor. Araştırmacılar, modelin “gerçekten düşünmekten” ziyade “insan gibi görünmeyi” başardığını ifade ediyor.
Ayrıca Turing testinin geçerliliği de bilim dünyasında tartışmalı.
Eleştiriler şu başlıklarda toplanıyor:
Davranış ve düşünce aynı şey değil.
Beyin, klasik makineler gibi çalışmaz.
Bilgisayarlar ile insanlar farklı yollardan benzer sonuçlara ulaşabilir.
Tek bir etkileşim, genel zekâyı ölçmek için yeterli değildir.
Gelecek ne getirir?
GPT-4.5’in testteki başarısı, yapay zekânın insan davranışlarını taklit etme becerisinin hızla geliştiğini gösteriyor. Ancak bu durum, makinelerin gerçekten “zeki” ya da “bilinçli” olduğu anlamına gelmiyor. Yine de, ikna edici ve güven telkin eden yapay zekâlar, birçok alanda insanları etkileyebilecek bir noktaya hızla yaklaşıyor.