Moonshot AI lanza un nuevo modelo de Kimi K2 Sistema de código abierto.

8 de noviembre de 2025

La Pekín con sede en empresa emergente anunció el jueves que Kimi K2 Thinking ya es accesible a través de Kimi.com y la interfaz de programación de aplicaciones (API) del modelo, lo que permite a los desarrolladores y empresas utilizar las funcionalidades del modelo en sus aplicaciones.

En una publicación de blog en la plataforma de desarrolladores en línea GitHub , los investigadores de Kimi dijeron que Kimi K2 Thinking estableció “nuevos récords en todas las pruebas de referencia que evalúan el razonamiento, la codificación y las capacidades del agente”.

Estos resultados reflejaron cómo las empresas chinas de IA han reducido la brecha de rendimiento entre sus modelos de código abierto y los modelos de código cerrado de sus homólogas estadounidenses. Anteriormente, los nuevos modelos chinos de IA de código abierto habían alcanzado popularidad internacional, pero su rendimiento era inferior al de los modelos estadounidenses de código cerrado.

“Hoy es un punto de inflexión en la IA. Un modelo chino de código abierto es el número 1”, escribió Deedy Das, socio de la firma de capital riesgo Menlo Ventures, en una publicación del viernes en X. “Momento crucial en la IA”.

Según la publicación del blog de GitHub, Kimi K2 Thinking superó a los modelos de código cerrado GPT-5 y Claude Sonnet 4.5 con una puntuación del 44,9 por ciento en Humanity’s Last Exam, una prueba de referencia de modelos de lenguaje grandes (LLM) que consta de 2.500 preguntas sobre una amplia gama de temas.

En la prueba de referencia BrowseComp, que evalúa la competencia en la navegación web y la persistencia en la búsqueda de información de los agentes LLM, Kimi K2 Thinking superó a los dos modelos estadounidenses con una puntuación del 60,2 por ciento.

El nuevo modelo de IA Moonshot obtuvo un 56,3 por ciento, liderando la prueba de referencia Seal-0, diseñada para desafiar a los LLM aumentados con búsqueda en consultas de investigación del mundo real.

Según su publicación en X, la consultora Artificial Analysis posicionó la variante Kimi K2 en el primer lugar de su prueba de referencia Tau-2 Bench Telecom para agentes, con una precisión del 93 %, la puntuación más alta que ha medido de forma independiente. Tau-2 Bench es una prueba de referencia de IA conversacional de doble control que simula escenarios de soporte técnico, donde tanto el agente como el usuario deben coordinar acciones para resolver problemas de servicio de telecomunicaciones.

“Kimi K2 Thinking alcanzó el puesto número 1 en… la prueba comparativa y es potencialmente el nuevo modelo [de código abierto] líder”, escribió la consultora.

El nuevo modelo cuenta con un billón de parámetros y está diseñado con una arquitectura de mezcla de expertos, que imita el enfoque humano para la resolución de problemas al dividir las tareas complejas entre un equipo de expertos especializados. Los parámetros son las variables internas que un modelo utiliza para realizar predicciones o tomar decisiones. Un mayor número de parámetros indica un mejor rendimiento.

Según los cálculos del Post, el coste de la API de Kimi K2 Thinking era entre 6 y 10 veces menor que el de los modelos de OpenAI y Anthropic.

Con el respaldo de las grandes tecnológicas chinas Alibaba Group Holding y Tencent Holdings , Moonshot AI atribuyó el rendimiento de su nuevo modelo a un enfoque de entrenamiento de «modelo como agente», que reforzó su capacidad para «utilizar diversas herramientas agentivas al razonar» sobre las tareas. Alibaba es propietaria del Post.

“Esto es lo más cerca que los modelos abiertos han estado jamás de la frontera cerrada de la IA de rendimiento”, escribió Nathan Lambert, investigador del Instituto Allen para la IA con sede en Seattle, en un artículo de Substack el viernes.

Lambert afirmó que el éxito de los desarrolladores chinos de IA de código abierto, incluidos Moonshot AI y DeepSeek , demostró cómo «hicieron sudar a los laboratorios cerrados».

“Existe una fuerte presión sobre los precios y expectativas que [los desarrolladores estadounidenses] deben gestionar”, afirmó.

El nuevo modelo de Moonshot AI demostró que “la brecha entre los modelos de IA cerrados y abiertos continúa reduciéndose”, escribió Mohammad Emad Mostaque, fundador del desarrollador británico Stability AI, en una publicación en X.


Comentarios

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *