Представлена VibeThinker-3B — новая компактная модель с 3 миллиардами параметров, ориентированная на задачи логического вывода. В основе разработки лежит архитектура Qwen2.5-Coder-3B, дообученная с использованием специализированного конвейера Spectrum-to-Signal. Модель распространяется под лицензией MIT, что позволяет использовать её в широком спектре проектов без существенных ограничений.

Несмотря на малый размер, VibeThinker-3B демонстрирует производительность, сопоставимую с более крупными системами, такими как DeepSeek V3.2 и Kimi K2.5, на ряде верифицируемых бенчмарков. Достигнутые результаты подтверждают эффективность методов пост-тренировки, направленных на улучшение способности моделей к пошаговому мышлению и решению сложных когнитивных задач.

Использование плотной (dense) архитектуры в сочетании с оптимизированным процессом обучения позволяет модели эффективно работать на ограниченных вычислительных ресурсах. Это делает VibeThinker-3B перспективным решением для локального развертывания и интеграции в агентные системы, где критически важны скорость отклика и точность логических операций.