16.07.2014 03:40
john_the_ripper
 
Прошедшей ночью, на одной из баз завис Oracle(перестал принимать соединения). В alert логе, появились следующие строки:

Цитата:
>>> WAITED TOO LONG FOR A ROW CACHE ENQUEUE LOCK! pid=78
System State dumped to trace file c:\admin\borisen\udump\borisen_ora_5008.trc
Wed Jul 16 01:44:09 2014
>>> WAITED TOO LONG FOR A ROW CACHE ENQUEUE LOCK! pid=11
Wed Jul 16 01:44:09 2014
>>> WAITED TOO LONG FOR A ROW CACHE ENQUEUE LOCK! pid=26
Wed Jul 16 08:12:49 2014
В указанном выше trc файле:

Цитата:
Dump file c:\admin\borisen\udump\borisen_ora_5008.trc
Wed Jul 16 01:44:09 2014
ORACLE V10.2.0.5.0 - 64bit Production vsnsta=0
vsnsql=14 vsnxtr=3
Oracle Database 10g Enterprise Edition Release 10.2.0.5.0 - 64bit Production
With the Partitioning, OLAP, Data Mining and Real Application Testing options
Windows NT Version V5.2 Service Pack 2
CPU : 16 - type 8664, 2 Physical Cores
Process Affinity : 0x0000000000000000
Memory (Avail/Total): Ph:13394M/16322M, Ph+PgF:15295M/17750M
Instance name: borisen

Redo thread mounted by this instance: 1

Oracle process number: 78

Windows thread id: 5008, image: ORACLE.EXE (SHAD)


*** 2014-07-16 01:44:09.160
*** ACTION NAME:() 2014-07-16 01:44:09.160
*** MODULE NAME:(Sm.Main.exe) 2014-07-16 01:44:09.160
*** SERVICE NAME:(SYS$USERS) 2014-07-16 01:44:09.160
*** SESSION ID:(110.46394) 2014-07-16 01:44:09.160
>>> WAITED TOO LONG FOR A ROW CACHE ENQUEUE LOCK! <<<
row cache enqueue: session: 000007FF9EB51070, mode: N, request: S
Ну и в последнем trc файле, после которого "жизнь" в оракле подвисла:

Цитата:
Dump file c:\admin\borisen\bdump\borisen_cjq0_4352.trc
Wed Jul 16 01:44:09 2014
ORACLE V10.2.0.5.0 - 64bit Production vsnsta=0
vsnsql=14 vsnxtr=3
Oracle Database 10g Enterprise Edition Release 10.2.0.5.0 - 64bit Production
With the Partitioning, OLAP, Data Mining and Real Application Testing options
Windows NT Version V5.2 Service Pack 2
CPU : 16 - type 8664, 2 Physical Cores
Process Affinity : 0x0000000000000000
Memory (Avail/Total): Ph:13415M/16322M, Ph+PgF:15317M/17750M
Instance name: borisen

Redo thread mounted by this instance: 1

Oracle process number: 11

Windows thread id: 4352, image: ORACLE.EXE (CJQ0)


*** 2014-07-16 01:44:09.348
*** SERVICE NAME:(SYS$BACKGROUND) 2014-07-16 01:44:09.348
*** SESSION ID:(161.1) 2014-07-16 01:44:09.348
>>> WAITED TOO LONG FOR A ROW CACHE ENQUEUE LOCK! <<<
row cache enqueue: session: 000007FF9EB95758, mode: N, request: S
ABORTING SYSTEM STATE DUMP: ANOTHER PROCESS (so = 0x000007FF9EA8FA48) EXECUTING SYSTEM STATE DUMP
После рестарта сервиса, все взлетело как ни в чем не бывало, но хочется приблизиться к пониманию что это было и как с этим бороться, что-бы не столкнуться в будущем. Всем заранее спасибо.
16.07.2014 08:35
OlegON
 
База в SHARED? DEDICATED пробовали подключаться, когда повисла?

Скрытый текст (вы должны войти под своим логином или зарегистрироваться и иметь 1000 сообщение(ий)):
У вас нет прав чтобы видеть скрытый текст, содержащийся здесь.
16.07.2014 09:38
john_the_ripper
 
Цитата:
OlegON База в SHARED? DEDICATED пробовали подключаться, когда повисла?
В серверном tnsnames явно (SERVER = DEDICATED) не было указано. Я так понимаю стоит указать?

Но тем не менее, работает именно в DEDICATED, насколько я понимаю:

Цитата:
SQL> select server,count(server) from v$session group by server;

SERVER COUNT(SERVER)
--------- -------------
DEDICATED 89
16.07.2014 09:46
OlegON
 
Диски не умирают? Совсем недавно на сломанной полке и куче юзеров база именно такое выдавала.
16.07.2014 12:20
bayan
 
Никакие сессии через alter system kill session не прибивали случаем? Ну и AWR, конечно, надо смотреть, что там происходило то вообще.
17.07.2014 07:38
john_the_ripper
 
Цитата:
OlegON Диски не умирают? Совсем недавно на сломанной полке и куче юзеров база именно такое выдавала.
На контроллере медиа эрроров не висит по винтам. Мистика) Тоже была такая мысль изначально.
17.07.2014 07:39
john_the_ripper
 
Цитата:
bayan Никакие сессии через alter system kill session не прибивали случаем? Ну и AWR, конечно, надо смотреть, что там происходило то вообще.
Неа, не прибивали
С awr не знаком. Повод изучить)
17.07.2014 08:22
OlegON
 
Цитата:
john_the_ripper На контроллере медиа эрроров не висит по винтам. Мистика) Тоже была такая мысль изначально.
Там тоже ошибок не было, просто тупили дичайше, пока не ткнул админов в это и они порты не поменяли на фибре.
18.08.2014 11:49
leonid
 
Цитата:
john_the_ripper Прошедшей ночью, на одной из баз завис Oracle(перестал принимать соединения). В alert логе, появились следующие строки:
вот и я на те же грабли наступил.
10.2.0.5 х64 на линуксе.
Оракл даже шотдауница штатно отказался.
18.08.2014 12:00
OlegON
 
И в чем дело было?
Часовой пояс GMT +3, время: 00:32.

Форум на базе vBulletin®
Copyright © Jelsoft Enterprises Ltd.
В случае заимствования информации гипертекстовая индексируемая ссылка на Форум обязательна.