Представлен WebBrain — open-source агент для браузеров Chrome и Firefox, предназначенный для автоматизации многошаговых задач и извлечения данных со страниц. Инструмент поддерживает локальный запуск моделей через Ollama или llama.cpp, что обеспечивает конфиденциальность данных, а также позволяет подключать сторонние облачные API для выполнения сложных сценариев взаимодействия с веб-контентом.

Архитектура агента базируется на двух основных режимах работы: «Ask» для анализа и ответов на вопросы по содержимому страниц и «Act» для выполнения последовательных действий. Благодаря открытой лицензии MIT, разработчики могут интегрировать WebBrain в собственные системы автоматизации, используя его как готовый слой взаимодействия с DOM-структурой сайтов.

Локально-ориентированный подход позволяет пользователям не передавать чувствительные данные на внешние серверы, что критично для корпоративных задач или обработки персональной информации. Гибкость настройки инференса делает решение пригодным для интеграции в различные агентные пайплайны, где требуется навигация по веб-интерфейсам без использования тяжелых проприетарных решений.

Ключевые факты

  • Поддерживает браузеры Google Chrome и Mozilla Firefox.
  • Работает на базе локальных моделей через Ollama и llama.cpp или облачных API.
  • Распространяется под лицензией MIT.
  • Реализует два режима работы: «Ask» (анализ контента) и «Act» (выполнение действий).
  • Ориентирован на автоматизацию многошаговых процессов и извлечение данных.