[ОТВЕТИТЬ]
Опции темы
16.06.2014 11:03
 
Есть мысль вывалить все ссылки из базы (искать по http) в текст, проверить их и отвечающие неконнектом или 404 (отсутствует) - вырезать (заменить на ''). Потом вырезать пустые теги url и img, а потом - удалить пустые сообщения, где ничего нет.
Кто-нибудь видит подвох в таком алгоритме? До убитых роликов ютуба я еще доберусь.
16.06.2014 23:47
 
В общем, под шумок эту ночь работает ... скрипт... признает только 200 ответ. Остальное вырезает. Ссылок придется проверить более 17000.
17.06.2014 08:32
 
отработало... предыдущий вариант сообщений забекапил, конечно. жертвы есть? сначала думал 301 и 302 оставить, но дикое количество мусора по ним, т.е. они редиректят все равно на 404, хотя есть и нормальные...
17.06.2014 08:40
 
Жертвы есть, блин... в 2 ночи рубанули связь на несколько минут, но куча ссылок оказалась в пролете... Возвращаю и перезапускаю...
17.06.2014 09:36
 
Поставил повтор только с 0 и 404.
Опции темы



Часовой пояс GMT +3, время: 06:52.

Все в прочитанное - Донат - RSS - - Карта - Вверх

Форум сделан на основе vBulletin®
Copyright ©2000 - 2017, Jelsoft Enterprises Ltd. Перевод: zCarot и OlegON
В случае заимствования информации гипертекстовая индексируемая ссылка на Форум обязательна.