Исследователи представили новый датасет для обнаружения многоэтапных кибератак, который включает логи систем, сетей и браузеров. Существующие публичные датасеты, такие как CICIDS и UNSW-NB15, охватывают только сетевую активность, в то время как другие, например LMDG, фокусируются на хост-активности.
Новый датасет содержит метки ATT&CK, что позволяет лучше анализировать и классифицировать атаки. Это важно, так как обнаружение кибератак требует корреляции событий из разных источников, а существующие датасеты не обеспечивают такой возможности.
Исследователи также провели оценку методов машинного обучения на новом датасете. Они показали, что модели могут эффективно учиться на межисточниковых паттернах, что улучшает точность обнаружения кибератак.
Датасет и результаты оценки опубликованы на arXiv и доступны для дальнейших исследований. Это важный шаг в развитии методов обнаружения кибератак с использованием машинного обучения.