[ОТВЕТИТЬ]
Опции темы
16.06.2014 11:03  
OlegON
Есть мысль вывалить все ссылки из базы (искать по http) в текст, проверить их и отвечающие неконнектом или 404 (отсутствует) - вырезать (заменить на ''). Потом вырезать пустые теги url и img, а потом - удалить пустые сообщения, где ничего нет.
Кто-нибудь видит подвох в таком алгоритме? До убитых роликов ютуба я еще доберусь.
 
16.06.2014 23:47  
OlegON
В общем, под шумок эту ночь работает ... скрипт... признает только 200 ответ. Остальное вырезает. Ссылок придется проверить более 17000.
 
17.06.2014 08:32  
OlegON
отработало... предыдущий вариант сообщений забекапил, конечно. жертвы есть? сначала думал 301 и 302 оставить, но дикое количество мусора по ним, т.е. они редиректят все равно на 404, хотя есть и нормальные...
 
17.06.2014 08:40  
OlegON
Жертвы есть, блин... в 2 ночи рубанули связь на несколько минут, но куча ссылок оказалась в пролете... Возвращаю и перезапускаю...
 
17.06.2014 09:36  
OlegON
Поставил повтор только с 0 и 404.
 
 
Опции темы



Часовой пояс GMT +3, время: 15:28.

Все в прочитанное - Календарь - RSS - - Карта - Вверх 👫 Яндекс.Метрика
Форум сделан на основе vBulletin®
Copyright ©2000 - 2016, Jelsoft Enterprises Ltd. Перевод: zCarot и OlegON
В случае заимствования информации гипертекстовая индексируемая ссылка на Форум обязательна.