Японская исследовательская компания Sakana AI выпустила семейство моделей Fugu, оптимизированных для работы с японским языком. Разработка базируется на архитектуре Mistral и использует методы эволюционного обучения для адаптации параметров под специфику лингвистических структур, иероглифики и культурного контекста региона. Основной упор сделан на повышение точности генерации текста и понимания сложных запросов, что традиционно является «узким местом» для глобальных мультиязычных моделей.
В основе подхода Sakana AI лежит автоматизированная стратегия дообучения, которая позволяет эффективно масштабировать возможности модели без необходимости ручной разметки огромных массивов данных. Исследователи применили метод «эволюционного слияния» (evolutionary model merging), при котором различные версии нейросетей комбинируются для поиска оптимальной конфигурации весов. Это позволило создать компактные и производительные решения, способные работать в условиях ограниченных вычислительных ресурсов, сохраняя при этом высокую когерентность ответов на японском языке.
Релиз включает в себя несколько версий модели, адаптированных под различные задачи — от чат-ботов до инструментов автоматического перевода и суммаризации документов. По результатам внутренних тестов, Fugu демонстрирует показатели, сопоставимые или превосходящие аналогичные по размеру модели от ведущих мировых разработчиков в задачах на японском языке. Инструменты уже доступны для ознакомления и интеграции в сторонние приложения, что открывает новые возможности для локальных компаний, нуждающихся в качественной языковой поддержке без использования тяжеловесных проприетарных систем.