|
|
|
| Парсю rss новости. Там попадается содержимое с сылками на свой сайт. Как их безболезнено удалить оттуда?
вот пример тега а:
<a title="<a href=http://www.teletrade.kiev.ua/grafstat.php?gr=19>Unemployment диаграмма</a>" style="font-weight: bold; color: rgb(0, 0, 0);" href="http://www.teletrade.kiev.ua/grafstat.php?gr=19%3EUnemployment%20%D0%B4%D0%B8%D0%B0%D0%B3%D1%80%D0%B0%D0%BC%D0%BC%D0%B0">
|
Я попробывал так:
$search = array("#<a[^>]+>#isU","'</a>'si");
$replace = array("","");
preg_replace($search, $replace, $text);
|
но удаляется только до первого закрываюзего знака ">". Как быть? | |
|
|
|
|
|
|
|
для: vasso_m
(07.05.2007 в 02:28)
| |
<?
$text = preg_replace ('/<a title="[^"]+"[^>]+>[^<]+<\/a>/isU', '', $text);
?>
|
возможно, так... | |
|
|
|
|
|
|
|
для: bronenos
(07.05.2007 в 07:33)
| | Этот вариант не работает.
Кроме того, аттрибут "title" может стоять в любом месте. | |
|
|
|
|
|
|
|
для: vasso_m
(07.05.2007 в 10:55)
| | никто не знает, да? | |
|
|
|
|
|
|
|
для: vasso_m
(07.05.2007 в 16:04)
| | всем лень думать за вас.
Могу посоветовать вот что.
1. < и > запрещенные символы xml, лучше использовать последовательность < и > Если можно то при создании rss это обеспечить. Тогда и разбор будет простой.
2. Самому заменить < (после) и > (перед) кавычкой. title="<. Сделали? смотрим пункт 1 | |
|
|
|
|
|
|
|
для: vasso_m
(07.05.2007 в 02:28)
| | preg_replace('~<a[^>]+title="<a[^>]+>.*</a>"[^>]*>|</a>~isU', "", $t); | |
|
|
|