Kimi K2.5: La Revolución de la Inteligencia Visual y los 'Enjambres de Agentes' en el Código Abierto
1/27/2026
El ecosistema del código abierto acaba de recibir a su nuevo rey. Hoy se ha presentado Kimi K2.5, un modelo multimodal nativo entrenado sobre una base colosal de aproximadamente 15 billones (15T) de tokens mixtos de visión y texto. K2.5 no se limita a procesar información; introduce un paradigma de "Inteligencia Agéntica Visual" que permite al modelo actuar, ver y programar con una autonomía nunca vista.
https://pbs.twimg.com/media/G_pUaPlaoAAa9as?format=jpg&name=large
https://statics.moonshot.cn/blogs/k2-5/20260127-131347.jpeg
La Era del Enjambre: Coordinación Autónoma La innovación más disruptiva de K2.5 es su capacidad de "Agent Swarm" (Enjambre de Agentes). Para tareas complejas, el modelo no actúa solo; actúa como un director de orquesta que crea y dirige automáticamente hasta 100 sub-agentes especializados. Estos agentes trabajan en paralelo, ejecutando hasta 1.500 llamadas a herramientas, lo que reduce el tiempo de ejecución hasta 4,5 veces en comparación con configuraciones de un solo agente.
https://statics.moonshot.cn/blogs/k2-5/token_cost.png
https://statics.moonshot.cn/blogs/k2-5/orchestrator-1.png
https://statics.moonshot.cn/blogs/k2-5/20260126-225846.png
Todo esto es posible gracias al Aprendizaje por Refuerzo de Agentes Paralelos (PARL). Este método entrena al orquestador para descomponer tareas y asignar sub-objetivos a agentes congelados dinámicos. El sistema evita el "colapso serial" —la tendencia a realizar tareas una tras otra— mediante recompensas que penalizan la lentitud y premian la ejecución concurrente, basándose en una métrica de "Pasos Críticos".
https://statics.moonshot.cn/blogs/k2-5/sota3_compressed.mp4
https://statics.moonshot.cn/blogs/k2-5/Sota2_compressed.mp4
Programación a través de la Visión Kimi K2.5 se posiciona como el modelo de código abierto más fuerte para la programación, especialmente en desarrollo front-end. Su capacidad de "Coding with Vision" permite razonar sobre imágenes y videos para generar código. Desde reconstruir un sitio web completo a partir de un video hasta visualizar algoritmos de ruta más corta (BFS) sobre un laberinto visual, el modelo elimina la barrera entre la intención visual y el código ejecutable. Estas herramientas están integradas en "Kimi Code", compatible con editores como VSCode.
https://statics.moonshot.cn/blogs/k2-5/sota5_compressed.mp4
https://statics.moonshot.cn/blogs/k2-5/sota4_compressed.mp4
Productividad y Rendimiento En el ámbito de la productividad de oficina, K2.5 maneja flujos de trabajo de alta densidad, como la creación de modelos financieros en hojas de cálculo o la redacción de documentos de 100 páginas. En las pruebas de referencia (benchmarks), K2.5 desafía y supera a modelos de la talla de GPT-5.2, Claude 4.5 Opus y Gemini 3 Pro en categorías críticas como HLE, SWE-Bench y BrowseComp. Disponible en cuatro modos, incluido el modo "Swarm" en beta, Kimi K2.5 representa un paso significativo hacia la AGI, demostrando que el código abierto puede liderar la frontera de la inteligencia artificial.
https://statics.moonshot.cn/blogs/k2-5/20260125-173909_2_compressed.mp4
https://statics.moonshot.cn/blogs/k2-5/img_v3_02ub_47858019-34ce-4e34-ae76-f7165f95b91g.png
https://statics.moonshot.cn/blog/k2-5/20260127-152311.png