Понадобилось тут получить от Яндекса несколько результатов поиска.
Процедуру получения XML расписывать не буду, все слишком тривиально:
Но, получил XML, что с ним делать? Сначала сунулся было через sed и awk его парсить - как-то сразу не срослось. Вспомнил, что на серваке давно установлены xmlstarlet. Это набор утилит для парсинга XML, чем я и не преминул воспользоваться. Для Яндекс.XML это делается следующим образом (мне нужно было достать <url>)
Код:
xml sel -T -t -v "/yandexsearch/response/results/grouping/group/doc/url"
на stdin подал полученный из curl результат, на выходе - список URL.