[ОТВЕТИТЬ]
Опции темы
11.04.2010 03:18
 
Итак, проблема началась с того, что при запуске бекапера зависает сервер, вместе с ним зависают кассы, пытаясь положить файл чека в его каталог.

Мониторинг: загруженность ЦП - ок, свободная память - ок.

Беру ручками, копирую гигабайтный файл с одного диска на другой: файл копируется за несколько секунд, затем, после завершения копирования (внезапно) сервер подвисает на несколько минут.

Я понимаю, что скорей всего это какой-то плохой элеватор в windows пытается ускорить программы, интенсивно изменяющие файлы, но видимо процесс получает высокий приоритет либо крутится в критическом куске кода и не передаёт управление шедулеру (кривой драйвер).

Кто-нибудь сталкивался? Я просто новичок в windows (да) и не знаю куда копать.

Контроллеры ЖД - ICH9 (2 шт).
Рейдов нет никаких.
Windows 2003 Server Enterprise
Политику поведения шедулера и виртуальной памяти менять пробовал (в свойствах системы, вкладка "Быстродействие") - безрезультатно.
11.04.2010 07:32
 
Цитата:
после завершения копирования (внезапно) сервер подвисает на несколько минут
- активность диска при этом какая?
- что с сетью в этот момент?
Можно попробовать perfmon.
Выбрать там несколько показателей и посмотреть, есть ли на каком из них скачки в момент затыков
11.04.2010 07:57
 
В журнале Windows есть какие-то записи за этот период? Есть ли какие-то "желтые" устройства в дистпетчере устройств? Винт случайно не рассыпается? У меня точно такие же симптомы были при помирании винта (не сигейт часом?). В журнале писалось, что система не может записать на винт. В общем - меняешь винт и все сказочно.
11.04.2010 12:28
 
Мне тоже кажется что проблема с веником, думаю следует посмотреть какой-нидь из утил SMART всех винтов...
11.04.2010 12:34
 
как вариант попробовать заменить шлейфы IDE/SATA
11.04.2010 14:46
 
Цитата:
konst как вариант попробовать заменить шлейфы IDE/SATA
В смарте есть один из параметров 199 Ultra DMA CRC errors, который как раз и укажет на хреновый шлейф... Вот тут можно взять бесплатную софтяру HDDScan | iHDD.RU для чтемния смарта работает без установки под виндой...
11.04.2010 15:42
 
Цитата:
В смарте есть один из параметров 199 Ultra DMA CRC errors, который как раз и укажет на хреновый шлейф... Вот тут можно взять бесплатную софтяру HDDScan | iHDD.RU для чтемния смарта работает без установки под виндой...
Скачал, всё зелёное, ошибок не находит.



Цитата:
В журнале Windows есть какие-то записи за этот период? Есть ли какие-то "желтые" устройства в дистпетчере устройств? Винт случайно не рассыпается? У меня точно такие же симптомы были при помирании винта (не сигейт часом?). В журнале писалось, что система не может записать на винт. В общем - меняешь винт и все сказочно.
Только таймауты: запись в какой-то левый файл C:\Windows... заняла слишком много времени; служба OracleService не ответила на запрос своевременно...


Цитата:
- активность диска при этом какая?
- что с сетью в этот момент?
Можно попробовать perfmon.
Выбрать там несколько показателей и посмотреть, есть ли на каком из них скачки в момент затыков
Я из perfmon и наблюдал. Всё нормально, кроме зашкаливающего процента времени обработки прерываний. Пингуется, уровнем выше ничего не обрабатывает до конца висяка (нельзя подключиться ни по rdp ни по vnc, smb и oracle тоже не отвечают).


Цитата:
Винт случайно не рассыпается?
Прогонял тест на сбойные блоки - ничего не выявил.
11.04.2010 15:51
 
Кстати я вам всем нагло врал, говоря, что рейдов нет: есть, на SRCSATAWB; только как здесь посмотреть, какой это рейд, сколько дисков? Управление дисками windows показывает один динамический том и всё. Сервер далеко, KVM over IP нету, соответственно залесть в настройки бивс или заглянуть внутрь корпуса сложновато.
11.04.2010 16:32
 
Итак, свежие данные: обновил драйверы на контроллеры винчестеров.


Копирую большой файл из одного каталога в разделе на рейде в другой каталог на этом же разделе: копируется долго, система не виснет, perfmon показывает большой обмен страниц и длину очереди диска.


Копирую этот же файл на другой винт, не в рейде: копируется быстро, в это время в perfmon большая длина очереди диска, при этом не скачут ни прерывания ни обмен страницами. Затем (файл "скопировался") обмен страницами и прерывания немного скачут и сервер подвисает на минуту. Perfmon останавливает свою работу в это время, rdp-сессия замирает. Когда отмирает, perfmon показывает только спад загруженности процессора.


Итак, пологаю что во втором случае проц закидывает прерываниями, после чего идёт ловина обработки нижних половин обработчиков с большим приоритетом, что вытесняет все остальные процессы (на всех четырёх ядрах?). Повесить бы прерывания винта на два из четырёх ядер?





Вот кстати такие ошибки вылазют в логи:

Тип события: Предупреждение
Источник события: NTDS ISAM
Категория события: Быстродействие
Код события: 507
Дата: 11.04.2010
Время: 16:24:45
Пользователь: Н/Д
Компьютер: SERVER-MAG
Описание:
NTDS (424) NTDSA: Запрос на чтение из файла "C:\WINDOWS\ntds\ntds.dit" со смещением 7389184 (0x000000000070c000) размером 8192 (0x00002000) байт выполнен, но его выполнение ОС заняло слишком много времени (109 секунд). Вероятно, эта ошибка вызвана сбоем оборудования. Обратитесь к поставщику оборудования, чтобы точно установить причину ошибки.

Дополнительные сведения можно найти в центре справки и поддержки, в "".
11.04.2010 18:25
 
Случаем, не проблема ли со свободным местом на диске?
***
Либо - логические ошибки на нем (сделай chkdsk Диск: /f )
***
Либо проблемы с рейд контроллером
***
Еще - под вопросом перегрев...


Опции темы



Часовой пояс GMT +3, время: 22:24.

Все в прочитанное - Донат - RSS - - Карта - Вверх

Форум сделан на основе vBulletin®
Copyright ©2000 - 2017, Jelsoft Enterprises Ltd. Перевод: zCarot и OlegON
В случае заимствования информации гипертекстовая индексируемая ссылка на Форум обязательна.