GPT-5.3-Codex Yayında: Kodlamadan Otonom İş Gücüne %25 Daha Hızlı Geçiş

07.02.2026

Yapay zeka dünyasında rekabet, sadece "daha akıllı" olmakla değil, "daha iş bitirici" olmakla ölçülen yeni bir evreye girdi. OpenAI, bugün duyurduğu GPT-5.3-Codex ile sadece bir kodlama asistanı değil, bilgisayar başında yapılan neredeyse tüm profesyonel işleri uçtan uca yürütebilen otonom bir ajan (agent) sunuyor. Claude Opus 4.6’nın hemen ardından gelen bu hamle, sektördeki güç dengelerini değiştirecek nitelikte. https://cdn.webrazzi.com/uploads/2026/02/swe-bench-pro-public-289.png Terminal ve Mühendislikte Rakipsiz Liderlik GPT-5.3-Codex’in en çarpıcı özelliği, kodlama ve terminal kullanımındaki hakimiyeti. Paylaşılan verilere göre model, otonom kodlama ajanlarının terminal becerilerini ölçen Terminal-Bench 2.0 testinde %77.3’lük bir başarı oranına ulaştı . Bu skor, bir önceki versiyon olan GPT-5.2-Codex’in (%64.0) ve standart GPT-5.2’nin (%62.2) çok ötesinde. Sadece test çözmekle kalmayan model, SWE-Bench Pro sonuçlarına göre daha az token harcayarak, daha karmaşık yazılım mühendisliği problemlerini çözebiliyor . https://cdn.webrazzi.com/uploads/2026/02/terminal-bench-20-217.png Kendi Kendini Eğiten Model Lansmanın en ilgi çekici detayı, modelin geliştirilme süreci. OpenAI mühendisleri, GPT-5.3-Codex’i geliştirirken yine modelin kendi erken versiyonlarını kullandılar. Model, kendi eğitim verilerindeki hataları ayıkladı, test sonuçlarını analiz etti ve hatta GPU kümelerini dinamik olarak ölçeklendirdi. Bu "kendi kendini geliştiren yapay zeka" döngüsü, hata oranlarını minimize ederken modelin karmaşık sorunlara yaklaşımını insan mühendis seviyesine çekiyor. Sadece Kod Değil: Finans, Moda ve Eğitim GPT-5.3-Codex, ismindeki "Codex" ibaresine rağmen sadece yazılımcılara hitap etmiyor. OpenAI’ın paylaştığı kullanım senaryoları, modelin GDPval (Knowledge Work) testlerinde de zirveye oynadığını gösteriyor . Örneğin: Finans: Bir servet yönetimi firmasında, mevduat sertifikaları ve değişken yıllık gelir sigortaları arasındaki riskleri analiz eden 10 slaytlık profesyonel bir sunum hazırlayabiliyor . Perakende: Bir gelinlik mağazasındaki satış ekibi için, müşteri itirazlarını karşılama üzerine detaylı bir eğitim dokümanı ve senaryo çalışması oluşturabiliyor . Tedarik Zinciri: Otomotiv sektöründe parça tedariği için karmaşık NPV (Net Bugünkü Değer) analizlerini Excel üzerinde formülleriyle birlikte kurgulayabiliyor . Hız ve Güvenlik Model, altyapı tarafında NVIDIA GB200 NVL72 sistemleri üzerinde eğitildi ve çalıştırılıyor. Bu donanım gücü, modelin önceki nesle göre %25 daha hızlı yanıt vermesini sağlıyor. Hız artarken güvenlikten ödün verilmemiş; model siber güvenlik açıklarını tespit etmede "Yüksek Yetenekli" olarak sınıflandırılıyor ve OpenAI, siber savunma için 10 milyon dolarlık bir hibe programı başlatıyor. Sonuç: Bir Araç Değil, Bir İş Arkadaşı GPT-5.3-Codex, statik bir yapay zeka olmaktan çıkıp, sizinle tartışan, ilerleme raporu sunan ve yönlendirmelerinize göre rotasını çizen interaktif bir ortağa dönüşmüş durumda. Özellikle OSWorld-Verified testindeki %64.7'lik başarısı , modelin bilgisayarı bir insan gibi görerek kullanabildiğini (tıklama, sürükleme, yazma) kanıtlıyor. OpenAI, bu hamlesiyle otonom ajan savaşlarında "ben de varım" demiyor, "lider benim" diyor.