Представлен WebBrain — open-source агент для браузеров Chrome и Firefox, предназначенный для автоматизации многошаговых задач и извлечения данных со страниц. Инструмент поддерживает локальный запуск моделей через Ollama или llama.cpp, что обеспечивает конфиденциальность данных, а также позволяет подключать сторонние облачные API для выполнения сложных сценариев взаимодействия с веб-контентом.
Архитектура агента базируется на двух основных режимах работы: «Ask» для анализа и ответов на вопросы по содержимому страниц и «Act» для выполнения последовательных действий. Благодаря открытой лицензии MIT, разработчики могут интегрировать WebBrain в собственные системы автоматизации, используя его как готовый слой взаимодействия с DOM-структурой сайтов.
Локально-ориентированный подход позволяет пользователям не передавать чувствительные данные на внешние серверы, что критично для корпоративных задач или обработки персональной информации. Гибкость настройки инференса делает решение пригодным для интеграции в различные агентные пайплайны, где требуется навигация по веб-интерфейсам без использования тяжелых проприетарных решений.
Ключевые факты
- Поддерживает браузеры Google Chrome и Mozilla Firefox.
- Работает на базе локальных моделей через Ollama и llama.cpp или облачных API.
- Распространяется под лицензией MIT.
- Реализует два режима работы: «Ask» (анализ контента) и «Act» (выполнение действий).
- Ориентирован на автоматизацию многошаговых процессов и извлечение данных.
