[ОТВЕТИТЬ]
Опции темы
11.04.2010 03:18  
blondbf
Итак, проблема началась с того, что при запуске бекапера зависает сервер, вместе с ним зависают кассы, пытаясь положить файл чека в его каталог.

Мониторинг: загруженность ЦП - ок, свободная память - ок.

Беру ручками, копирую гигабайтный файл с одного диска на другой: файл копируется за несколько секунд, затем, после завершения копирования (внезапно) сервер подвисает на несколько минут.

Я понимаю, что скорей всего это какой-то плохой элеватор в windows пытается ускорить программы, интенсивно изменяющие файлы, но видимо процесс получает высокий приоритет либо крутится в критическом куске кода и не передаёт управление шедулеру (кривой драйвер).

Кто-нибудь сталкивался? Я просто новичок в windows (да) и не знаю куда копать.

Контроллеры ЖД - ICH9 (2 шт).
Рейдов нет никаких.
Windows 2003 Server Enterprise
Политику поведения шедулера и виртуальной памяти менять пробовал (в свойствах системы, вкладка "Быстродействие") - безрезультатно.
 
11.04.2010 07:32  
Propil
Цитата:
после завершения копирования (внезапно) сервер подвисает на несколько минут
- активность диска при этом какая?
- что с сетью в этот момент?
Можно попробовать perfmon.
Выбрать там несколько показателей и посмотреть, есть ли на каком из них скачки в момент затыков
 
11.04.2010 07:57  
Ivan Drago
В журнале Windows есть какие-то записи за этот период? Есть ли какие-то "желтые" устройства в дистпетчере устройств? Винт случайно не рассыпается? У меня точно такие же симптомы были при помирании винта (не сигейт часом?). В журнале писалось, что система не может записать на винт. В общем - меняешь винт и все сказочно.
 
11.04.2010 12:28  
Shlong
Мне тоже кажется что проблема с веником, думаю следует посмотреть какой-нидь из утил SMART всех винтов...
 
11.04.2010 12:34  
konst
как вариант попробовать заменить шлейфы IDE/SATA
 
11.04.2010 14:46  
Shlong
Цитата:
Сообщение от konst
как вариант попробовать заменить шлейфы IDE/SATA
В смарте есть один из параметров 199 Ultra DMA CRC errors, который как раз и укажет на хреновый шлейф... Вот тут можно взять бесплатную софтяру HDDScan | iHDD.RU для чтемния смарта работает без установки под виндой...
 
11.04.2010 15:42  
blondbf
Цитата:
В смарте есть один из параметров 199 Ultra DMA CRC errors, который как раз и укажет на хреновый шлейф... Вот тут можно взять бесплатную софтяру HDDScan | iHDD.RU для чтемния смарта работает без установки под виндой...
Скачал, всё зелёное, ошибок не находит.



Цитата:
В журнале Windows есть какие-то записи за этот период? Есть ли какие-то "желтые" устройства в дистпетчере устройств? Винт случайно не рассыпается? У меня точно такие же симптомы были при помирании винта (не сигейт часом?). В журнале писалось, что система не может записать на винт. В общем - меняешь винт и все сказочно.
Только таймауты: запись в какой-то левый файл C:\Windows... заняла слишком много времени; служба OracleService не ответила на запрос своевременно...


Цитата:
- активность диска при этом какая?
- что с сетью в этот момент?
Можно попробовать perfmon.
Выбрать там несколько показателей и посмотреть, есть ли на каком из них скачки в момент затыков
Я из perfmon и наблюдал. Всё нормально, кроме зашкаливающего процента времени обработки прерываний. Пингуется, уровнем выше ничего не обрабатывает до конца висяка (нельзя подключиться ни по rdp ни по vnc, smb и oracle тоже не отвечают).


Цитата:
Винт случайно не рассыпается?
Прогонял тест на сбойные блоки - ничего не выявил.
 
11.04.2010 15:51  
blondbf
Кстати я вам всем нагло врал, говоря, что рейдов нет: есть, на SRCSATAWB; только как здесь посмотреть, какой это рейд, сколько дисков? Управление дисками windows показывает один динамический том и всё. Сервер далеко, KVM over IP нету, соответственно залесть в настройки бивс или заглянуть внутрь корпуса сложновато.
 
11.04.2010 16:32  
blondbf
Итак, свежие данные: обновил драйверы на контроллеры винчестеров.


Копирую большой файл из одного каталога в разделе на рейде в другой каталог на этом же разделе: копируется долго, система не виснет, perfmon показывает большой обмен страниц и длину очереди диска.


Копирую этот же файл на другой винт, не в рейде: копируется быстро, в это время в perfmon большая длина очереди диска, при этом не скачут ни прерывания ни обмен страницами. Затем (файл "скопировался") обмен страницами и прерывания немного скачут и сервер подвисает на минуту. Perfmon останавливает свою работу в это время, rdp-сессия замирает. Когда отмирает, perfmon показывает только спад загруженности процессора.


Итак, пологаю что во втором случае проц закидывает прерываниями, после чего идёт ловина обработки нижних половин обработчиков с большим приоритетом, что вытесняет все остальные процессы (на всех четырёх ядрах?). Повесить бы прерывания винта на два из четырёх ядер?





Вот кстати такие ошибки вылазют в логи:

Тип события: Предупреждение
Источник события: NTDS ISAM
Категория события: Быстродействие
Код события: 507
Дата: 11.04.2010
Время: 16:24:45
Пользователь: Н/Д
Компьютер: SERVER-MAG
Описание:
NTDS (424) NTDSA: Запрос на чтение из файла "C:\WINDOWS\ntds\ntds.dit" со смещением 7389184 (0x000000000070c000) размером 8192 (0x00002000) байт выполнен, но его выполнение ОС заняло слишком много времени (109 секунд). Вероятно, эта ошибка вызвана сбоем оборудования. Обратитесь к поставщику оборудования, чтобы точно установить причину ошибки.

Дополнительные сведения можно найти в центре справки и поддержки, в "".
 
11.04.2010 18:25  
Propil
Случаем, не проблема ли со свободным местом на диске?
***
Либо - логические ошибки на нем (сделай chkdsk Диск: /f )
***
Либо проблемы с рейд контроллером
***
Еще - под вопросом перегрев...
 
 


Опции темы



Часовой пояс GMT +3, время: 05:28.

Все в прочитанное - Календарь - RSS - - Карта - Вверх 👫 Яндекс.Метрика
Форум сделан на основе vBulletin®
Copyright ©2000 - 2016, Jelsoft Enterprises Ltd. Перевод: zCarot и OlegON
В случае заимствования информации гипертекстовая индексируемая ссылка на Форум обязательна.