Исследователи представили архитектуру, которая отказывается от использования трансформеров и классического обучения на огромных массивах данных. Вместо генерации текста на основе вероятностных предсказаний, система использует механизм воздержания от ответа в ситуациях, когда данных недостаточно для формирования точного вывода. Это позволяет минимизировать галлюцинации, характерные для современных больших языковых моделей.
Технология опирается на принципиально иные алгоритмические подходы, исключающие необходимость облачных вычислений для инференса. Модель работает локально, что обеспечивает высокую скорость обработки запросов и приватность данных. Отсутствие этапа обучения в привычном понимании сокращает затраты на подготовку системы к работе и позволяет внедрять её в средах с ограниченными вычислительными ресурсами.
Данный метод фокусируется на достоверности ответов, отдавая приоритет качеству информации над объемом сгенерированного текста. В случаях, когда модель не обладает достаточной уверенностью в фактах, она сообщает об этом пользователю, вместо того чтобы пытаться подобрать наиболее вероятные слова. Такой подход может стать значимым дополнением к существующим инструментам для задач, где критически важна точность и отсутствие выдуманных данных.