Görsel Ajan Zekasında Yeni Dönem: Kimi K2.5 ve Kendi Kendini Yöneten "Ajan Sürüsü" Devrimi
27.01.2026
Yapay zeka dünyasında kartlar yeniden dağıtılıyor. Bugün tanıtılan Kimi K2.5, sadece parametre sayısıyla değil, sunduğu "Görsel Ajan Zekası" (Visual Agentic Intelligence) mimarisiyle açık kaynak modeller arasında şimdiye kadarki en güçlü oyuncu olarak sahneye çıktı. Yaklaşık 15 trilyon karışık görsel ve metin token'ı üzerinde eğitilen bu yeni model, yapay zekanın sadece "düşünen" değil, aynı zamanda "gören" ve "hareket eden" bir yapıya bürünmesini sağlıyor.
https://pbs.twimg.com/media/G_pUaPlaoAAa9as?format=jpg&name=large
https://statics.moonshot.cn/blogs/k2-5/20260127-131347.jpeg
Merkeziyetçi Yapıdan "Sürü Zekasına" Geçiş: Agent Swarm Kimi K2.5’in en çarpıcı yeniliği, şüphesiz "Agent Swarm" (Ajan Sürüsü) teknolojisi. Geleneksel tekil ajan yapılarının aksine, K2.5 karmaşık bir görevle karşılaştığında önceden tanımlanmış bir iş akışına ihtiyaç duymadan, kendi kendini yöneten 100'e yakın alt ajan oluşturabiliyor. Bu dijital ordu, paralel olarak 1.500'e kadar araç çağrısı (tool calls) yaparak iş süreçlerini tek bir ajana kıyasla 4,5 kata kadar hızlandırıyor.
https://statics.moonshot.cn/blogs/k2-5/token_cost.png
Sistem, "Paralel Ajan Pekiştirmeli Öğrenme" (PARL) adı verilen yeni bir eğitim metodolojisiyle destekleniyor. PARL sayesinde model, görevleri dinamik olarak parçalara ayırıyor ve her bir parça için özelleşmiş (örneğin Fizik Araştırmacısı veya Doğrulama Uzmanı gibi) dondurulmuş alt ajanlar atıyor. Bu yapı, yapay zeka sistemlerinde sıkça görülen "seri çöküş" (serial collapse) sorununu, yani kapasite varken bile işlerin sırayla yapılması hatasını ortadan kaldırıyor.
https://statics.moonshot.cn/blogs/k2-5/sota3_compressed.mp4
https://statics.moonshot.cn/blogs/k2-5/Sota2_compressed.mp4
Görerek Kodlayan Mühendis Kimi K2.5, kodlama yeteneklerinde de çıtayı görsel boyuta taşıyor. Sadece metin komutlarıyla değil, görseller ve videolar üzerinden akıl yürüterek karmaşık ön yüz (front-end) geliştirmeleri yapabiliyor. Tanıtımda gösterilen bir örnekte, modelin bir videoyu analiz ederek web sitesini yeniden inşa ettiği ve Matisse’in "Dans" tablosunun estetiğini bir uygulamaya otonom olarak uyarladığı görülüyor. Bu yetenek, "Kimi Code" ürünüyle terminale ve VSCode gibi popüler IDE'lere entegre edilerek yazılım mühendislerine görsel hata ayıklama (visual debugging) imkanı sunuyor.
https://statics.moonshot.cn/blogs/k2-5/sota5_compressed.mp4
https://statics.moonshot.cn/blogs/k2-5/sota4_compressed.mp4
https://statics.moonshot.cn/blog/k2-5/20260127-152311.png
Ofis Verimliliği ve Benchmark Sonuçları Model sadece kodlama değil, ağır ofis yüklerini de sırtlıyor. 10.000 kelimelik makaleler veya 100 sayfalık dökümanlar üzerinde çalışabilen K2.5, elektronik tablolarda finansal modeller oluşturmaktan Word'de notlar almaya kadar uçtan uca ofis görevlerini yönetiyor.
https://statics.moonshot.cn/blogs/k2-5/20260125-173909_2_compressed.mp4
https://statics.moonshot.cn/blogs/k2-5/img_v3_02ub_47858019-34ce-4e34-ae76-f7165f95b91g.png
https://statics.moonshot.cn/blog/k2-5/20260127-152311.png
Yayınlanan benchmark tabloları ise oldukça iddialı. Kimi K2.5, HLE, SWE-Bench Verified ve BrowseComp gibi kritik testlerde, GPT-5.2 (xhigh), Claude 4.5 Opus ve Gemini 3 Pro gibi (henüz piyasaya sürülmemiş veya üst segment) rakiplerine karşı, maliyetinin çok altında bir kaynakla üstün veya başa baş performans sergiliyor. Özellikle "Agent Swarm" moduyla BrowseComp testlerinde %78.4'lük bir başarı oranına ulaşarak, tekil ajanların yapabildiklerinin çok ötesine geçiyor. Kimi K2.5, açık kaynak topluluğu için AGI (Yapay Genel Zeka) yolunda atılmış somut ve devrimsel bir adım olarak konumlanıyor.
https://statics.moonshot.cn/blogs/k2-5/orchestrator-1.png
https://statics.moonshot.cn/blogs/k2-5/20260126-225846.png