Компания GitHub представила подробности создания внутреннего инструмента Qubot, который позволяет сотрудникам запрашивать аналитические данные с помощью естественного языка. Система построена на базе технологий GitHub Copilot и предназначена для упрощения доступа к корпоративной статистике без необходимости глубокого знания SQL или сложных инструментов визуализации.

В процессе разработки инженеры сфокусировались на обеспечении точности ответов и безопасности данных. Основная архитектура решения опирается на связку LLM с внутренними хранилищами информации, что требует строгой проверки генерируемых запросов к базам данных. Команда внедрила многоуровневую систему верификации, которая минимизирует риск галлюцинаций и гарантирует, что агент оперирует только актуальными и проверенными метриками.

Ключевым выводом проекта стала важность подготовки качественных метаданных и документации для внутренних таблиц. Без четкого описания структуры данных даже продвинутые языковые модели допускают ошибки при интерпретации бизнес-показателей. Опыт GitHub показывает, что создание подобных агентных систем требует не только настройки инференса, но и значительных инвестиций в подготовку инфраструктуры данных и создание семантического слоя, понятного для ИИ.