Главный научный сотрудник Meta (признана экстремистской организацией, деятельность запрещена в РФ) Ян Лекун представил подробный разбор архитектуры мировых моделей (World Models). По мнению исследователя, текущие подходы, основанные исключительно на предсказании следующего токена, ограничены в понимании физической реальности и причинно-следственных связей. Для создания систем уровня человеческого интеллекта ИИ должен научиться строить внутреннюю модель мира, которая позволяет предсказывать последствия действий и планировать поведение в динамической среде.
В основе предлагаемого подхода лежит архитектура JEPA (Joint-Embedding Predictive Architecture). В отличие от стандартных генеративных моделей, которые пытаются восстановить каждый пиксель или слово, JEPA работает в абстрактном пространстве представлений. Это позволяет системе игнорировать нерелевантные детали и фокусироваться на ключевых концепциях и закономерностях. Такой метод значительно снижает вычислительные затраты и позволяет модели обучаться на неразмеченных данных, наблюдая за процессами в окружающем мире, подобно тому, как это делают живые существа.
Лекун подчеркивает, что мировые модели станут фундаментом для следующего поколения автономных агентов. Эти системы смогут не просто генерировать контент, а решать сложные многоэтапные задачи, требующие понимания физики объектов и долгосрочного планирования. Переход от чисто статистического обучения к моделированию реальности рассматривается как критический шаг для преодоления текущих ограничений LLM и достижения уровня рассуждения, необходимого для полноценной автоматизации интеллектуальной деятельности.