Итак, пока XZ мучается с полутерабайтом, попробую другие архиваторы.
Возьмем дамп базы форума (только текст 663M)
694869302 Mar 16 09:40 test.dmp
Код:
time xz -9e test.dmp
real 18m16.601s
user 18m13.984s
sys 0m0.648s
66738424
При приблизительно таком же размере, экстремальное сжатие работает значительно дольше, чем год назад… Почти вдвое. Зато и разница уже не килобайты.
Код:
time xz test.dmp
real 4m53.133s
user 4m52.307s
sys 0m0.299s
68909264
Старина arj еще жив, хотя и опции максимальной компрессии не предоставляет. Версия 3.10.22
Код:
time arj a test.dmp.arj test.dmp
real 0m35.330s
user 0m34.790s
sys 0m0.215s
110489799
Пробую свои излюбленные когда-то оцпии максимального сжатия, видно, что используются несколько потоков
Код:
time 7z a -mx=9 -ms=on -t7z -m0=lzma2 test.dmp.7z test.dmp
real 2m17.435s
user 8m39.318s
sys 0m2.099s
67725934
В обычном режиме не очень быстро, но нормально жмет...
Код:
time 7z a test.dmp.7z test.dmp
real 1m9.680s
user 5m41.905s
sys 0m1.486s
72564591
ZPAQ впечатлил компрессией и тем, что загрузил все ядра на 100% на некоторое время. Обращаю внимание, что это инкрементальный архиватор, т.е. если запихнуть в него существующие файлы, то сохранятся обе версии с временными метками.
Код:
time zpaq a test.zpaq test.dmp -m5
real 8m13.187s
user 47m59.825s
sys 0m7.137s
47700552
Без максимального сжатия жмет влет, но и результаты так себе... Да, графической оболочки не встретил, но и не особенно искал. Если у кого падает по памяти - смотрите параметр -t, т.е. количество потоков.
Код:
time zpaq a test.zpaq test.dmp
real 0m6.515s
user 0m29.901s
sys 0m1.437s
132392418
По gzip, собственно, никаких комментариев...
Код:
time gzip -9 test.dmp
real 1m20.833s
user 1m20.551s
sys 0m0.184s
109232579
Быстро, но слабо
Код:
time gzip test.dmp
real 0m21.428s
user 0m21.199s
sys 0m0.199s
111667188
Выполнил сначала с ключом максимальной компрессии, потом - без, удивился одинаковым результатам, залез в ман, действительно, по умолчанию как раз максимальное сжатие.
Код:
time bzip2 test.dmp
real 0m54.690s
user 0m54.371s
sys 0m0.236s
91187225
Разбавлю проприетарщиной
Код:
time rar a -m5 test.dmp.rar test.dmp
real 0m41.575s
user 3m58.984s
sys 0m1.208s
89726629
Нет, мне такое ни к чему
Код:
time rar a test.dmp.rar test.dmp
real 0m19.417s
user 1m35.708s
sys 0m1.167s
91197474
Листал пакеты, случайно обнаружил старика прошлого века
Код:
time arc a test.arc test.dmp
real 0m10.949s
user 0m10.720s
sys 0m0.215s
199709220
Не попадался раньше... Наткнулся случайно в пакетах...
Код:
time lzip -9 test.dmp
real 11m52.661s
user 11m50.199s
sys 0m0.407s
67080052
Неплохо, но как-то бессмысленно использовать в силу не особой популярности.
Код:
time lzip test.dmp
real 4m8.647s
user 4m7.954s
sys 0m0.253s
71916116
Итоговые результаты по максимальному сжатию
Код:
zpaq 47700552
xz 66738424
lzip 67080052
7z 67725934
rar 89726629
bzip2 91187225
gzip 109232579
arj 110489799
arc 199709220
Итоговые результаты по скорости максимального сжатия (i7 Haswell,SSD)
Код:
arc 0m10.949s
arj 0m35.330s
rar 0m41.575s
bzip2 0m54.690s
gzip 1m20.833s
7z 2m17.435s
zpaq 8m13.187s
lzip 11m52.661s
xz 18m16.601s
Итоговые результаты по скорости среднего сжатия (i7 Haswell,SSD)
Код:
zpaq 0m6.515s
arc 0m10.949s
rar 0m19.417s
gzip 0m21.428s
arj 0m35.330s
bzip 0m54.690s
7z 1m9.680s
lzip 4m7.954s
xz 4m53.133s
Какие выводы для себя сделал… Собственно, от архивации в 7z, понятно, не откажусь. Популярный архиватор и степень сжатия неплохая. Что плохо - он не выдается на среднем сжатии по скорости, но сжимают, как правило, не на скорость, кому она нужна - сжимает на уровне файловой системы. Порадовал XZ, явно его продолжают пилить и с некоторыми успехами. Порадовал старички arc и arj, просто своим присутствием :) Я думал, что они давно в истории. Rar неплохо выступает по скорости, но по сжатию весьма посредственно. Впрочем, я его серьезно и не рассматривал. Очень заинтересовал ZPAQ. Незнаю, насколько это стабильный проект, но он уже в стабильной ветке (в прошлом тестировании, как я помню, была еще только бета, потому и не рассматривалась). На очень долгое время архивы лучше не делать, некоторая непопулярность продукта может привести к тому, что через несколько лет архив будет нечем открыть. А так - очень интересно… Еще и кроссплатформенный.
Для себя рассматриваю исключительно 7z, bzip, gzip, xz. Посмотрим, может, добавлю zpaq локально образы хранить.