01.09.2012 14:26
OlegON
 
Стало тут открытием, что строка вида
Код:
<.*>
будет выбирать "<jhg>>>>><html>", а не "<jhg>". Труднообъяснимое поведение, но в целом логичное. Зависит еще от "жадности" регекспа, но побороть в sed мне эту жадность не удалось.
Напоролся еще полгода назад, когда парсил какой-то погодный xml. Соответственно, чтобы выбирать нормально теги, надо искать без закрывающейся скобки, т.е. вроде
Код:
s/<[^>]*>//g
т.е. не любой символ, а любой, кроме "^"
Часовой пояс GMT +3, время: 21:55.

Форум на базе vBulletin®
Copyright © Jelsoft Enterprises Ltd.
В случае заимствования информации гипертекстовая индексируемая ссылка на Форум обязательна.