
NVIDIA, OpenAI ile yaptığı iş birliği kapsamında, yeni gpt-oss açık model ailesini tüketicilere sundu. Bu ortaklık, daha önce yalnızca bulut tabanlı sistemlerde çalışan ileri düzey yapay zeka teknolojilerini, RTX destekli PC’ler ve iş istasyonlarında yüksek hızda ve yerel olarak çalıştırılabilir hale getiriyor.
Yeni modeller, NVIDIA’nın GeForce RTX ve RTX PRO GPU’larının sunduğu güçlü işlem kapasitesiyle desteklenerek, cihaz üzerinde çalışan yapay zekada yeni bir dönemi başlatıyor. İki yeni model dikkat çekiyor:
- Gpt-oss-20b, en az 16 GB VRAM’e sahip RTX AI PC’lerde saniyede 250 token üretme kapasitesine sahip.
- Gpt-oss-120b ise profesyonel iş istasyonları için RTX PRO GPU’lar ile çalışacak şekilde tasarlandı.
Her iki model de, NVIDIA H100 GPU’larında eğitildi ve model doğruluğunu artıran MXFP4 hassasiyet formatınıdestekleyen ilk modeller oldu. Ayrıca, yerel çalıştırmada 131 bin token uzunluğuna kadar bağlam desteği sunmaları da öne çıkan özelliklerden.
OpenAI’nin bu modelleri, talimat takibi, düşünce zinciri ve araç kullanımı gibi gelişmiş kabiliyetlere sahip, mixture-of-experts (MoE) mimarisiyle geliştirildi.
NVIDIA, geliştiriciler için üç platform öneriyor:
- Ollama uygulaması ile modelleri kolayca test etmek mümkün.
- Llama.cpp, açık kaynak topluluğu katkısıyla CUDA Graphs desteğiyle optimize edildi.
- Microsoft AI Foundry Local, Windows geliştiricilerine terminal üzerinden hızlı kurulum olanağı sunuyor.
NVIDIA CEO’su Jensen Huang, OpenAI ile yapılan bu iş birliğinin, ABD’nin yapay zeka liderliğini pekiştirdiğini vurguladı.