Исследователи продемонстрировали необычный метод сжатия данных, используя архитектуру трансформера. В ходе эксперимента модель объемом 900 КБ была целенаправленно переобучена (overfitted) на конкретном наборе данных — CSV-файле размером 100 МБ. В результате удалось достичь высокой степени компрессии, сократив исходный объем информации до 7 МБ.
Метод основан на способности нейронных сетей запоминать закономерности внутри обучающей выборки. Вместо классических алгоритмов сжатия, таких как gzip или zstd, модель «выучивает» структуру данных, превращая их в веса нейронной сети. При необходимости восстановления исходного файла модель генерирует данные, опираясь на заложенные в параметры связи.
Данный подход открывает новые перспективы в области хранения данных и передачи информации, где критически важен минимальный размер архива. Несмотря на то, что процесс обучения требует значительных вычислительных ресурсов, а восстановление данных ограничено точностью модели, этот эксперимент показывает потенциал использования глубокого обучения для задач, традиционно решаемых алгоритмами сжатия без потерь.