[ОТВЕТИТЬ]
16.06.2014 11:03
OlegON
 
Есть мысль вывалить все ссылки из базы (искать по http) в текст, проверить их и отвечающие неконнектом или 404 (отсутствует) - вырезать (заменить на ''). Потом вырезать пустые теги url и img, а потом - удалить пустые сообщения, где ничего нет.
Кто-нибудь видит подвох в таком алгоритме? До убитых роликов ютуба я еще доберусь.
16.06.2014 23:47
OlegON
 
В общем, под шумок эту ночь работает ... скрипт... признает только 200 ответ. Остальное вырезает. Ссылок придется проверить более 17000.
17.06.2014 08:32
OlegON
 
отработало... предыдущий вариант сообщений забекапил, конечно. жертвы есть? сначала думал 301 и 302 оставить, но дикое количество мусора по ним, т.е. они редиректят все равно на 404, хотя есть и нормальные...
17.06.2014 08:40
OlegON
 
Жертвы есть, блин... в 2 ночи рубанули связь на несколько минут, но куча ссылок оказалась в пролете... Возвращаю и перезапускаю...
17.06.2014 09:36
OlegON
 
Поставил повтор только с 0 и 404.
Опции темы


Часовой пояс GMT +3, время: 15:11.

 

Форум сделан на основе vBulletin®
Copyright ©2000 - 2018, Jelsoft Enterprises Ltd. Перевод: zCarot и OlegON
В случае заимствования информации гипертекстовая индексируемая ссылка на Форум обязательна.