Nuevo modelo QwQ: Alibaba revoluciona la IA con lógica y precisión

Alibaba lanza QwQ-32B-Preview: un modelo de IA enfocado en razonamiento lógico y resolución de problemas 

Alibaba ha presentado QwQ-32B-Preview, un nuevo modelo de inteligencia artificial centrado en habilidades de razonamiento lógico y solución de problemas. Este modelo parece igualar, e incluso superar en algunos aspectos, las últimas propuestas de OpenAI. 

El equipo de IA de Alibaba, Qwen, ha revelado que su modelo cuenta con 32.5 mil millones de parámetros y puede procesar hasta 32,000 palabras de contexto. QwQ-32B-Preview ha demostrado resultados sobresalientes en pruebas matemáticas como AIME y MATH, destacando especialmente en los indicadores MATH-500 y GPQA. 

Capacidades de autocorrección 

Al igual que los modelos o1 de OpenAI, QwQ incluye un sistema de verificación interna. Antes de dar una respuesta, el modelo la planifica y revisa, lo que aumenta el tiempo de procesamiento, pero mejora la precisión en comparación con otros modelos lingüísticos. El equipo de Qwen destaca este enfoque filosófico: 

QwQ encarna ese espíritu filosófico antiguo: sabe que no sabe nada, y eso impulsa su curiosidad. Antes de ofrecer una respuesta, se cuestiona sus propias suposiciones, explora distintos caminos y busca siempre una verdad más profunda. Sin embargo, como todo buscador de sabiduría, QwQ tiene sus limitaciones. Esta versión es apenas un primer paso en un largo camino: un estudiante que aún aprende a razonar. A veces, sus pensamientos divagan, sus respuestas no son completas, y su sabiduría sigue creciendo. Pero, ¿no es esa la esencia del verdadero aprendizaje? Ser capaz y humilde, conocedor y siempre cuestionador.

Equipo de investigación de Qwen

Desafíos conocidos 

Los investigadores reconocen ciertas deficiencias. QwQ a veces cambia de idioma inesperadamente, queda atrapado en bucles o tiene dificultades con el razonamiento de sentido común, problemas habituales en los modelos centrados en la lógica. 

Disponibilidad y licenciamiento 

QwQ se ha lanzado bajo la licencia Apache 2.0, permitiendo su uso comercial. Sin embargo, Alibaba solo ha liberado ciertos componentes, lo que impide su reproducción completa por ahora. Hay una demostración disponible en Hugging Face. 

El primer modelo Qwen fue presentado por Alibaba en agosto de 2023. Poco después, llegó Qwen2, una versión más potente con mejoras en programación, matemáticas, lógica y capacidades multilingües. La serie Qwen 2.5 incluye versiones especializadas: Qwen2.5 para lenguaje general, Qwen2.5-Coder para programación, Qwen2.5-Math y la reciente Qwen2.5-Turbo, diseñada para procesar contextos más amplios. 

Creciente presencia de China en la IA 

QwQ es el segundo modelo de “razonamiento” desarrollado en China. Recientemente, DeepSeek presentó un sistema similar que también compite con OpenAI. Aunque ambos modelos están disponibles solo en versiones preliminares, se espera que sus versiones completas lleguen este año. 

La rápida llegada de estos modelos chinos, apenas semanas después del lanzamiento de o1 de OpenAI, plantea interrogantes sobre la ventaja competitiva de OpenAI. Sin embargo, las capacidades completas del modelo o1 de OpenAI aún no se han revelado, especialmente en lo referente a la escalabilidad. Podría haber más en estos modelos de lo que parece a simple vista, y las diferencias arquitectónicas aún podrían darle a OpenAI una ventaja distinta. 

Vía | Alibaba’s QwQ model takes on OpenAI o1 with enhanced reasoning capabilities