MiniMax, M2.7 ile modelin kendi evrimini öne çıkardı

12.04.2026
MiniMax, 18 Mart 2026 tarihli duyurusunda M2.7 modelini, “kendi evrimine derin biçimde katılan” ilk model olarak konumlandırdı. Şirketin aktardığına göre M2.7, yalnızca görev tamamlayan bir sistem olarak değil, aynı zamanda kendi ajan altyapısını, beceri setlerini ve hafıza düzenini iyileştirme döngüsünde aktif rol alan bir model olarak geliştirildi. Bu yaklaşım, model iterasyon hızını artırma hedefiyle, insan yönlendirmesini korurken modelin daha fazla sorumluluk üstlenmesine dayanıyor. https://filecdn.minimax.chat/public/platform_web/offical-news/%E9%A3%9E%E4%B9%A6%E4%BA%91%E6%96%87%E6%A1%A3/img-1.png Duyuruda M2.7’nin karmaşık agent harness yapıları kurabildiği, Agent Teams, gelişmiş Skills ve dinamik araç arama gibi yeteneklerle ayrıntılı üretkenlik görevlerini tamamlayabildiği belirtildi. MiniMax, model geliştirme sürecinde M2.7’nin kendi hafızasını güncellediğini, pek çok karmaşık beceri inşa ettiğini ve takviyeli öğrenme deneylerinden gelen sonuçlara göre kendi öğrenme sürecini ve altyapısını iyileştirdiğini söyledi. Şirkete göre bu yapı, modelin kendi gelişimine katıldığı döngüsel bir süreci başlatıyor. https://filecdn.minimax.chat/public/platform_web/offical-news/%E9%A3%9E%E4%B9%A6%E4%BA%91%E6%96%87%E6%A1%A3/img-2.png MiniMax’in paylaştığı kullanım örnekleri, özellikle araştırma ve yazılım mühendisliği iş akışlarına odaklanıyor. Şirket, kurum içindeki bir M2.7 sürümünün farklı araştırma ekipleriyle çalışan bir araştırma ajanı altyapısı kurduğunu; bu yapının veri hatları, eğitim ortamları, altyapı, ekipler arası iş birliği ve kalıcı hafıza desteği sunduğunu aktardı. Günlük iş akışında ise bir araştırmacının deney fikrini ajanla tartışabildiği, ajanın literatür taramasına yardımcı olduğu, deney spesifikasyonunu takip ettiği, veri ve diğer çıktı hatlarını hazırladığı ve deneyleri başlatabildiği ifade edildi. Deneyler sırasında sistemin log okuma, hata ayıklama, metrik analizi, kod düzeltme, merge request ve smoke test gibi adımları tetikleyebildiği, böylece kritik kararlar dışında insan müdahalesi ihtiyacını azalttığı vurgulandı. MiniMax, M2.7’nin bu akışın yüzde 30 ila 50’sini üstlenebildiğini belirtti. https://filecdn.minimax.chat/public/platform_web/offical-news/%E9%A3%9E%E4%B9%A6%E4%BA%91%E6%96%87%E6%A1%A3/img-3.png Şirket, modelin kendi altyapısını yinelemeli biçimde geliştirme kabiliyetinin de önemli olduğunu kaydetti. Verilen örneklerden birinde M2.7’nin bir iç programlama iskeletinde 100’den fazla tur boyunca tamamen otonom biçimde çalıştığı, başarısızlık izlerini analiz ettiği, değişiklik planladığı, scaffold kodunu düzenlediği, değerlendirmeler çalıştırdığı, sonuçları karşılaştırdığı ve değişiklikleri tutma ya da geri alma kararı verdiği aktarıldı. Bu sürecin sonunda iç değerlendirme setlerinde yüzde 30’luk performans artışı elde edildiği söylendi. https://filecdn.minimax.chat/public/platform_web/offical-news/%E9%A3%9E%E4%B9%A6%E4%BA%91%E6%96%87%E6%A1%A3/video-1.mp4 Performans tarafında MiniMax, M2.7’nin gerçek dünya yazılım mühendisliği görevlerinde güçlü sonuçlar verdiğini bildirdi. Kaynağa göre model; uçtan uca proje teslimi, log analizi, hata giderme, kod güvenliği ve makine öğrenimi gibi alanlarda öne çıktı. SWE-Pro’da yüzde 56,22 doğruluk oranına ulaşan M2.7, VIBE-Pro’da 55,6 ve Terminal Bench 2’de 57,0 skor aldı. Şirket ayrıca SWE Multilingual’da 76,5 ve Multi-SWE Bench’te 52,7 sonucunu paylaştı. Ofis yazılımları tarafında ise Excel, PowerPoint ve Word üzerinde çok turlu revizyon ve yüksek doğruluklu düzenleme kabiliyetinin geliştirildiği belirtildi. GDPval-AA değerlendirmesinde ELO puanının 1495 olduğu, Toolathon’da 46,3 doğruluk elde edildiği ve MM Claw testinde 40 karmaşık beceri boyunca yüzde 97 beceri uyumu korunduğu ifade edildi. https://filecdn.minimax.chat/public/platform_web/offical-news/%E9%A3%9E%E4%B9%A6%E4%BA%91%E6%96%87%E6%A1%A3/video-2.mp4 https://file.cdn.minimax.io/public/d92a6eb4-a4b8-4906-b76a-d627c814a2c0.gif MiniMax, düşük kaynaklı senaryolarda da M2.7 ile ön testler yürüttüğünü açıkladı. Buna göre model, OpenAI tarafından açık kaynaklanan MLE Bench Lite seviyesindeki 22 makine öğrenimi yarışmasına katıldı. Üç denemede 24 saatlik yinelemeli evrim süreci sonunda en iyi koşunun 9 altın, 5 gümüş ve 1 bronz madalya aldığı; üç koşunun ortalama madalya oranının yüzde 66,6’ya ulaştığı bildirildi. Şirket ayrıca M2.7’nin karakter tutarlılığı ve duygusal zekâ tarafında da güçlendirildiğini, bunun üretkenlik odaklı kullanımın ötesinde yeni etkileşim biçimlerine alan açtığını belirtti. Bu kapsamda tanıtılan OpenRoom demosu, metin akışının ötesine geçen, web arayüzünde etkileşimli ajan deneyimi sunan bir sistem olarak gösterildi. https://filecdn.minimax.chat/public/d070816d-2c2a-4a5c-a441-48c9dd19d44d.mp4