Для эффективной работы ИИ-агентов с веб-сайтами разработчики представили решение, которое преобразует сложные структуры DOM в упрощенное дерево доступности (accessibility tree). Вместо передачи агенту избыточного и громоздкого кода страницы, инструмент выделяет только семантически значимые элементы, необходимые для навигации и выполнения действий.
Использование сырого DOM-дерева часто приводит к перерасходу токенов и снижению точности выполнения задач из-за «шума» в контекстном окне. Новый подход позволяет сжать представление страницы, сохраняя при этом логическую структуру интерфейса. Это упрощает для модели понимание того, какие кнопки, поля ввода и ссылки доступны для взаимодействия, минимизируя вероятность ошибок при генерации команд.
Решение реализовано в виде CLI-утилиты, которую можно интегрировать в пайплайны автоматизации. Такой метод обработки данных повышает производительность агентных систем при работе с браузерными задачами, делая процесс взаимодействия с веб-интерфейсами более предсказуемым и экономичным с точки зрения потребления вычислительных ресурсов.