[ОТВЕТИТЬ]
25.06.2010 12:21
whitewizard
 
база стартует, но минут через несколько сваливается в "принят конец файла по коммуникационному каналу".

алерт.лог:

Dump file D:\ORACLE\admin\VEL\bdump\velALRT.LOG
Fri Jun 25 19:04:53 2010
ORACLE V8.1.6.3.0 - Production vsnsta=0
vsnsql=e vsnxtr=3
Windows 2000 Version 5.2 Service Pack 2, CPU type 586
Starting up ORACLE RDBMS Version: 8.1.6.3.0.
System parameters with non-default values:
processes = 150
shared_pool_size = 536870912
large_pool_size = 614400
java_pool_size = 32768
control_files = D:\ORACLE\oradata\VEL\control01.ctl, D:\ORACLE\oradata\VEL\control02.ctl, D:\ORACLE\oradata\VEL\control03.ctl
db_block_buffers = 60000
db_block_size = 8192
compatible = 8.1.6
log_buffer = 32768
log_checkpoint_interval = 10000
log_checkpoint_timeout = 1800
db_files = 1024
db_file_multiblock_read_count= 8
max_enabled_roles = 30
remote_login_passwordfile= EXCLUSIVE
global_names = TRUE
distributed_transactions = 10
instance_name = VEL
service_names = VEL
sort_area_size = 65536
sort_area_retained_size = 65536
db_name = VEL
open_cursors = 100
os_authent_prefix =
job_queue_processes = 3
job_queue_interval = 60
parallel_max_servers = 5
background_dump_dest = D:\ORACLE\admin\VEL\bdump
user_dump_dest = D:\ORACLE\admin\VEL\udump
max_dump_file_size = 10240
oracle_trace_collection_name=
PMON started with pid=2
DBW0 started with pid=3
LGWR started with pid=4
CKPT started with pid=5
SMON started with pid=6
RECO started with pid=7
SNP0 started with pid=8
SNP1 started with pid=9
SNP2 started with pid=10
Fri Jun 25 19:04:56 2010
alter database mount exclusive
Fri Jun 25 19:05:01 2010
Successful mount of redo thread 1, with mount id 3561628573.
Fri Jun 25 19:05:01 2010
Database mounted in Exclusive Mode.
Completed: alter database mount exclusive
Fri Jun 25 19:05:01 2010
alter database open
Beginning crash recovery of 1 threads
Fri Jun 25 19:05:01 2010
Thread recovery: start rolling forward thread 1
Recovery of Online Redo Log: Thread 1 Group 3 Seq 38358 Reading mem 0
Mem# 0 errs 0: D:\ORACLE\ORADATA\VEL\REDO03.LOG
Fri Jun 25 19:05:01 2010
Thread recovery: finish rolling forward thread 1
Thread recovery: 111 data blocks read, 111 data blocks written, 935 redo blocks read
Crash recovery completed successfully
Fri Jun 25 19:05:02 2010
Thread 1 advanced to log sequence 38359
Thread 1 opened at log sequence 38359
Current log# 1 seq# 38359 mem# 0: D:\ORACLE\ORADATA\VEL\REDO01.LOG
Successful open of redo thread 1.
Fri Jun 25 19:05:02 2010
SMON: enabling cache recovery
SMON: enabling tx recovery
Fri Jun 25 19:05:02 2010
Completed: alter database open
Fri Jun 25 19:06:22 2010
ALTER SYSTEM SET timed_statistics=TRUE;
Fri Jun 25 19:06:28 2010
ALTER TABLESPACE "TEMP" DEFAULT STORAGE ( INITIAL 1032K )
Completed: ALTER TABLESPACE "TEMP" DEFAULT STORAGE ( INITIAL
Fri Jun 25 19:06:29 2010
ALTER TABLESPACE "TEMP" DEFAULT STORAGE ( NEXT 2056K )
Completed: ALTER TABLESPACE "TEMP" DEFAULT STORAGE ( NEXT 205
Fri Jun 25 19:06:29 2010
ALTER TABLESPACE "TEMP" DEFAULT STORAGE ( PCTINCREASE 0 )
Completed: ALTER TABLESPACE "TEMP" DEFAULT STORAGE ( PCTINCRE
Fri Jun 25 19:06:29 2010
ALTER TABLESPACE "TEMP" DEFAULT STORAGE (MAXEXTENTS UNLIMITED)
Completed: ALTER TABLESPACE "TEMP" DEFAULT STORAGE (MAXEXTENT
Fri Jun 25 19:06:29 2010
alter tablespace "TEMP" coalesce
Completed: alter tablespace "TEMP" coalesce
Fri Jun 25 19:07:00 2010
DBW0: terminating instance due to error 472
Instance terminated by DBW0, pid = 15552

Какие есть мысли по восстановлению?
25.06.2010 12:41
baggio
 
не весь лог значить выложил...
должны быть трасерты...
их тоже выложи...
гдето ora-600 должна быть...
25.06.2010 12:51
John Doe
 
Цитата:
whitewizard Какие есть мысли по восстановлению?
RBS все пересоздай... Вообще хорош трупики трогать, переходи на 10ку.
25.06.2010 12:55
whitewizard
 
так надо трупик восстановить и на 10-ку перевести :)

а ora-600 нету
25.06.2010 12:59
Mtirt
 
А
DBW0: terminating instance due to error 472
что значит?
25.06.2010 13:00
baggio
 
Цитата:
whitewizard так надо трупик восстановить и на 10-ку перевести :)

а ora-600 нету
Что было толчком для данной проблемы...
что то менялось?
Трасертов точно нет?
25.06.2010 13:02
whitewizard
 
ничего не менялось.
работала база сама по себе и никто её вообще не трогал.
возможно свет дёргался.
25.06.2010 13:04
John Doe
 
Цитата:
Mtirt А
DBW0: terminating instance due to error 472
что значит?
вот оно...
Цитата:
oerr ORA 472
00472, 00000, "PMON process terminated with error"
// *Cause: The process cleanup process died
// *Action: Warm start instance
25.06.2010 13:06
baggio
 
Цитата:
Mtirt А
DBW0: terminating instance due to error 472
что значит?
ИМХО похлже на проблемы при попытке записи врайтером в файлы БД... либо в контрольники либо в редо...

1. Забэкапить что есть
2. Прогнать чекдиск...
3. Должны быть *.trc за это время.. они должны по любому быть...

4. попытатся поднять через DBA или скуль и смотреть что они говорят...
25.06.2010 13:10
whitewizard
 
velSMON.trc

Dump file D:\ORACLE\admin\VEL\bdump\velSMON.TRC
Fri Jun 25 20:05:40 2010
ORACLE V8.1.6.3.0 - Production vsnsta=0
vsnsql=e vsnxtr=3
Windows 2000 Version 5.2 Service Pack 2, CPU type 586
Oracle8i Enterprise Edition Release 8.1.6.3.0 - Production
JServer Release 8.1.6.3.0 - Production
Windows 2000 Version 5.2 Service Pack 2, CPU type 586
Instance name: veles

Redo thread mounted by this instance: 1

Oracle process number: 6

Windows thread id: 17008, image: ORACLE.EXE


*** SESSION ID:(5.1) 2010-06-25 20:05:40.812
Using 5 slaves for 1 dead transactions
25.06.2010 13:20
Mtirt
 
поиск предлагает:
Цитата:
Take a COLD backup.
SVRMGR> connect internal
SVRMGR> startup mount
SVRMGR> recover database until cancel;
SVRMGR> alter database open resetlogs;. statement processed.
25.06.2010 13:43
whitewizard
 
апосля recover database until cancel
как поругалось:

ORA-00279: change 282489942 generated at 06/25/2010 20:17:54 needed for thread 1
ORA-00289: suggestion : D:\ORACLE\ORA81\RDBMS\ARC38363.001
ORA-00280: change 282489942 for thread 1 is in sequence #38363
Specify log: {<RET>=suggested | filename |AUTO | CANCEL}

ORA-01547: warning: RECOVER succeeded but OPEN RESETLOGS would get error below
ORA-01194: file 1 needs more recovery to be consistent
ORA-01110: data file 1: 'D:\ORACLE\ORADATA\VEL\SYSTEM01.DBF'
25.06.2010 14:16
John Doe
 
Читаешь алерт вслух громко и с выражением. Восстанавливаешься из бекапа и пробуешь то, что я тебе предложил. Тут где-то писали, как восстанавливаться в таких случаях, подкладывая редо-логи вместо архивлогов, можешь попробовать так.
25.06.2010 14:32
baggio
 
ИМХО... если слетело с утра и данных набили мало...
и есть бэкап за вчера... накатывай бэкап....
так будет проще...
если всё грустно и бэкапы придумали трусы... тогда пиши будем плакать вместе...
25.06.2010 14:34
whitewizard
 
половина исправилась. теперь все выглядит так:

SVRMGR> connect internal/qqq@vel;
Connected.
SVRMGR> startup mount;
ORACLE instance started.
Total System Global Area 1041454044 bytes
Fixed Size 70620 bytes
Variable Size 549785600 bytes
Database Buffers 491520000 bytes
Redo Buffers 77824 bytes
Database mounted.
SVRMGR> recover database until cancel;
ORA-00279: change 282530336 generated at 06/25/2010 21:26:10 needed for thread 1

ORA-00289: suggestion : C:\ORACLE\ORA81\RDBMS\ARC00001.001
ORA-00280: change 282530336 for thread 1 is in sequence #1
Specify log: {<RET>=suggested | filename | AUTO | CANCEL}
d:\oracle\oradata\veles\redo03.log
Log applied.
Media recovery complete.
SVRMGR> alter database open resetlogs;
Statement processed.
SVRMGR> shutdown;
ORA-03113: end-of-file on communication channel
25.06.2010 14:37
whitewizard
 
последний бэкап весьма давнишний, т.к. винт с бесконтрольной машины помер до того, как я до сервера этого добрался удалённо.
25.06.2010 14:42
John Doe
 
Да сдался тебе resetlogs! восстанови и просто открывай. Я про тот бекап, что ты, как приехал, сделал.
25.06.2010 14:44
whitewizard
 
Цитата:
John Doe Да сдался тебе resetlogs! восстанови и просто открывай. Я про тот бекап, что ты, как приехал, сделал.
что куда восстанавливать? (под вечер мозг, пережаренный температурой +35 на дворе, слабо вникает в реальность)
25.06.2010 14:48
baggio
 
Засжую...
Ты как приехал и ДО того как начал ковырятся в базе бэкап сделал?
25.06.2010 14:49
John Doe
 
Я про это. Проделай без resetlogs
25.06.2010 14:59
whitewizard
 
сделал с noresetlogs

ничего не изменилось, собственно :)
25.06.2010 15:00
whitewizard
 
конечно у меня есть копия до начала ковыряния :)
25.06.2010 15:08
kadr
 
Цитата:
whitewizard половина исправилась. теперь все выглядит так:

SVRMGR> connect internal/qqq@vel;
Connected.
SVRMGR> startup mount;
ORACLE instance started.
Total System Global Area 1041454044 bytes
Fixed Size 70620 bytes
Variable Size 549785600 bytes
Database Buffers 491520000 bytes
Redo Buffers 77824 bytes
Database mounted.
SVRMGR> recover database until cancel;
ORA-00279: change 282530336 generated at 06/25/2010 21:26:10 needed for thread 1

ORA-00289: suggestion : C:\ORACLE\ORA81\RDBMS\ARC00001.001
ORA-00280: change 282530336 for thread 1 is in sequence #1
Specify log: {<RET>=suggested | filename | AUTO | CANCEL}
d:\oracle\oradata\veles\redo03.log
Log applied.
Media recovery complete.
SVRMGR> alter database open resetlogs;
Statement processed.
SVRMGR> shutdown;
ORA-03113: end-of-file on communication channel
Зачем тебе после подъема базы делать её остановку?
Поднял базу, вытащил из неё данные, залил в чистую, эту похоронил. Иначе можно в дальнейшем на такой базе ещё голвную боль заработать и вылезет совершенно в неожиданном месте
25.06.2010 15:11
whitewizard
 
так прикол в том, что она поднимается и через пару секунд падает
25.06.2010 15:14
whitewizard
 
и после перезапуска табличные пространства TEMP не очищаются.
мож какая то зависшая транзакция всё ломает?
25.06.2010 15:15
baggio
 
пробуй экспорт импорт...
25.06.2010 15:20
whitewizard
 
экспорт начинает делаться и на exporting roles падает в ORA-03113
25.06.2010 15:33
whitewizard
 
сейчас лог выглядит так:

Dump file D:\ORACLE\admin\VELES\bdump\velesALRT.LOG
Fri Jun 25 22:28:19 2010
ORACLE V8.1.6.3.0 - Production vsnsta=0
vsnsql=e vsnxtr=3
Windows 2000 Version 5.2 Service Pack 2, CPU type 586
Starting up ORACLE RDBMS Version: 8.1.6.3.0.
System parameters with non-default values:
processes = 150
shared_pool_size = 536870912
large_pool_size = 614400
java_pool_size = 32768
control_files = D:\ORACLE\oradata\VELES\control01.ctl, D:\ORACLE\oradata\VELES\control02.ctl, D:\ORACLE\oradata\VELES\control03.ctl
db_block_buffers = 60000
db_block_size = 8192
compatible = 8.1.6
log_buffer = 32768
log_checkpoint_interval = 10000
log_checkpoint_timeout = 1800
db_files = 1024
db_file_multiblock_read_count= 8
max_enabled_roles = 30
remote_login_passwordfile= EXCLUSIVE
global_names = TRUE
distributed_transactions = 10
instance_name = VELES
service_names = VELES
sort_area_size = 65536
sort_area_retained_size = 65536
db_name = VELES
open_cursors = 100
ifile = c:\ORACLE\admin\VELES\pfile\initVELES.ora
os_authent_prefix =
job_queue_processes = 3
job_queue_interval = 60
parallel_max_servers = 5
background_dump_dest = D:\ORACLE\admin\VELES\bdump
user_dump_dest = D:\ORACLE\admin\VELES\udump
max_dump_file_size = 10240
oracle_trace_collection_name=
PMON started with pid=2
DBW0 started with pid=3
LGWR started with pid=4
CKPT started with pid=5
SMON started with pid=6
RECO started with pid=7
SNP0 started with pid=8
SNP1 started with pid=9
SNP2 started with pid=10
Fri Jun 25 22:28:22 2010
alter database mount
Fri Jun 25 22:28:26 2010
Successful mount of redo thread 1, with mount id 3561614410.
Fri Jun 25 22:28:26 2010
Database mounted in Exclusive Mode.
Completed: alter database mount
Fri Jun 25 22:28:26 2010
alter database open
Beginning crash recovery of 1 threads
Fri Jun 25 22:28:26 2010
Thread recovery: start rolling forward thread 1
Recovery of Online Redo Log: Thread 1 Group 2 Seq 38360 Reading mem 0
Mem# 0 errs 0: D:\ORACLE\ORADATA\VELES\REDO02.LOG
Fri Jun 25 22:28:26 2010
Thread recovery: finish rolling forward thread 1
Thread recovery: 19 data blocks read, 19 data blocks written, 41 redo blocks read
Crash recovery completed successfully
Fri Jun 25 22:28:26 2010
Thread 1 advanced to log sequence 38361
Thread 1 opened at log sequence 38361
Current log# 3 seq# 38361 mem# 0: D:\ORACLE\ORADATA\VELES\REDO03.LOG
Successful open of redo thread 1.
Fri Jun 25 22:28:26 2010
SMON: enabling cache recovery
SMON: enabling tx recovery
Fri Jun 25 22:28:27 2010
Completed: alter database open
Fri Jun 25 22:30:25 2010
DBW0: terminating instance due to error 472
Instance terminated by DBW0, pid = 2508
25.06.2010 15:39
baggio
 
может вот это поможет

_ALLOW_RESETLOGS_CORRUPTION = true
_CORRUPTED_ROLLBACK_SEGMENTS = true
_ALLOW_READ_ONLY_CORRUPTION = tue

с данными параметрами сделать resetlog...


Хотя мы по моему все закопались ... я так и не вижу , кто виноват то...
или я что то пропустил? кто знает почему база валится?
25.06.2010 15:44
John Doe
 
в последний раз предлагаю все rbs пересоздать... посмотри в FAQ про потерю роллбеков.

Админ виноват, который до сих пор на 8ке сидит и бекапов не делает.


Опции темы


Часовой пояс GMT +3, время: 01:01.

 

Форум сделан на основе vBulletin®
Copyright ©2000 - 2018, Jelsoft Enterprises Ltd. Перевод: zCarot и OlegON
В случае заимствования информации гипертекстовая индексируемая ссылка на Форум обязательна.