SAM 3.1: 16 Nesne Takibinde Hız İkiye Katlandı
29.03.2026
Görüntü işleme ve yapay zeka tabanlı video analitiği alanında standartları belirleyen SAM 3 modelinin geniş çaplı benimsenmesinin ardından, arka planda yürütülen optimizasyon çalışmaları meyvesini verdi. Geliştirici ekip, 27 Mart 2026 tarihi itibarıyla video işleme verimliliğinde yapısal bir dönüşüm sunan SAM 3.1 sürümünü resmi olarak yayımladı. Mevcut sistemlere doğrudan, hiçbir ek entegrasyon zorluğu yaratmadan (drop-in) entegre edilebilen bu yeni model, hesaplama mimarisinde radikal bir değişimi temsil ediyor.
https://video.fsaw2-3.fna.fbcdn.net/o1/v/t2/f2/m412/AQOXHJjHo1OyLAKwvUuZimNzN9wECtu_-Wi7e_aPA98k_uAFexWprtqYyVkj-w2WMgVJUEA21jd3uNpscG_k0FoDnJbjBMVKZdofDFV-0g.mp4?_nc_cat=104&_nc_oc=AdolEtMzfPwWRx9oqbfzq4EuXSjIsYNfg5bkfAS3gCiRt4yGIzJ_0EtrQ9IhQIoBJ3k&_nc_sid=8bf8fe&_nc_ht=video.fsaw2-3.fna.fbcdn.net&_nc_ohc=Jqu_lsB2i1UQ7kNvwErdCX9&efg=eyJ2ZW5jb2RlX3RhZyI6Inhwdl9wcm9ncmVzc2l2ZS5GQUNFQk9PSy4uQzMuNjQwLnN2ZV9zZCIsInhwdl9hc3NldF9pZCI6MTMyNjQzNzU2ODY4Mjc4NywiYXNzZXRfYWdlX2RheXMiOjEzNSwidmlfdXNlY2FzZV9pZCI6MTAxMjgsImR1cmF0aW9uX3MiOjI3LCJ1cmxnZW5fc291cmNlIjoid3d3In0%3D&ccb=17-1&_nc_gid=BFuAFkRlh_dwebUwgQA8Iw&_nc_ss=7a30f&_nc_zt=28&oh=00_AfzgJ5ve1joy73qqp9-Z2tkPPlNLkxIZBSy28ZJXDTbMyQ&oe=69CEC71A&bitrate=462041&tag=sve_sd
SAM 3.1'in kalbinde, görsel mimaride de net bir şekilde görülen "Nesne Çoklama" (Object Multiplexing) ve "Küresel Akıl Yürütme" (Global Reasoning) teknolojileri yatıyor. Önceki nesil SAM 3 mimarisi, ekrandaki her bir nesneyi izole edilmiş, ayrı işlem hatlarında (separate computations) değerlendiriyordu. Bu durum, donanım üzerinde ciddi bir bellek darboğazı ve gereksiz hesaplama yükü oluşturuyordu. SAM 3.1 ise "Mux" (Çoğullayıcı) modülü sayesinde T-1 anındaki farklı nesneleri tek bir veri akışında birleştiriyor. Model, bu birleşik veriyi tek bir ileri geçişte (single computation) işleyerek "Demux" (Tekilleştirici) modülü ile T anındaki sonuçlara ayrıştırıyor.
https://scontent.fsaw2-3.fna.fbcdn.net/v/t39.2365-6/658783005_976222541732621_4396625680307590489_n.png?_nc_cat=104&ccb=1-7&_nc_sid=e280be&_nc_ohc=yHtgqgXKD2oQ7kNvwHuTfj_&_nc_oc=AdrTCk6p3bk0fAmV1rD3_OEsZRyzlpaghfndS7yMFdjtyWMN_RstPD_4u6eOsJpSWQA&_nc_zt=14&_nc_ht=scontent.fsaw2-3.fna&_nc_gid=BFuAFkRlh_dwebUwgQA8Iw&_nc_ss=7a30f&oh=00_AfyMmEar0Pw4ZRmG89QcO2bwuk3LoF342Cm6HKl_8cS7_Q&oe=69E3369D
Bu mimari devrim, modelin tek bir işlem döngüsünde tam 16 farklı nesneyi eşzamanlı olarak takip etmesini sağlıyor. Performans metrikleri bu değişimin etkisini rakamlarla kanıtlıyor: Orta yoğunluktaki videolarda işlem hızı tam iki katına çıkarak, tek bir Nvidia H100 GPU üzerinde saniyede 16 kareden (fps) 32 kareye ulaşıyor. Kalabalık ve karmaşık sahnelerde bile gerçek zamanlı nesne takibini kesintisiz hale getiren SAM 3.1, donanım kaynak tüketimini minimize ederek yüksek performanslı uygulamaların daha küçük ve erişilebilir sistemlerde çalıştırılmasının önünü açıyor. Geliştiriciler ve araştırmacılar, güncellenen SAM 3.1 model dosyasını, revize edilmiş kod tabanını ve araştırma makalesini anında indirebilir; yeni mimariyi Segment Anything Playground üzerinden doğrudan test edebilirler.