Тут буду собирать информацию о том, как оценивать состояние системы с помощью значений LA (load average) и всех желающих приглашаю к дискуссии, дополнениям и т.п.
Для начала о том, как получить LA. Самый простой способ
наиболее распространенный - запуск uptime
Код:
olegon@oops ~ $ uptime
15:45:01 up 7 days, 6:23, 2 users, load average: 2,35, 2,26, 2,24
в качестве варианта - запуск всяческих htop и top. Вот картинка загрузки веб-сервера olegon.ru
Теперь о том, что же это за магические цифры. В большинстве статей они так средним чем-то и остаются, в других куча воды про умножение производительности на количестве ядер, но на самом деле все просто. Это среднее число активных и ожидающих CPU процессов за 1, 5 и 15 минут.
Иными словами, запускаете вы 1 процесс, он работает и грузит ядро - получается 1.00, запускаете второй - 2.00, третий - 3.00, первый отработал - 2.00. Из среднего количества за интервал времени и получаются выводимые цифры. Отличный способ навскидку оценить состояние системы. Если предыдущее число больше последующего - нагрузка падает, меньше - растет. Считается, что если есть свободные ядра (LA<кол-ва ядер), то система нормально работает.
Важное замечание. LA может колебаться и подсчитываться неточно, реальное состояние системы может не быть отражено в этом показателе, если в системе достаточное количество nice-процессов, есть закрепленные за конкретным процессором процессы или в ядре используется NO_HZ, а так же аналогичные параметры.