|
|
|
| Здравствуйте!
Парсю html, нужно выдернуть из него все картинки, я пытаюсь поймать строки вида 'src="blablabla.format"'
тестовая html-ка такая:
<p><img height="21" width="87" src="/userfiles/avavav.GIF" alt="" /></p>
<p><img height="138" width="150" src="/userfiles/cd81c20268fd8f7940a41d19fd89aa01.jpg" alt="" /></p>
|
Пишу:
ereg("src=\"(\w+(.jpg|.gif|.png|.JPG|.GIF|.PNG))\"",$postedValue,$Pictures);//в postedValue - html код.
|
Не работает нифига (ничего не возвращает).
Пишу:
ereg("src=\"(.+(.jpg|.gif|.png|.JPG|.GIF|.PNG))\"",$postedValue,$Pictures);
|
array(3) {
[0]=>
string(129) "src="/userfiles/avavav.GIF" alt="" /></p>
<p><img height="138" width="150" src="/userfiles/cd81c20268fd8f7940a41d19fd89aa01.jpg""
[1]=>
string(123) "/userfiles/avavav.GIF" alt="" /></p>
<p><img height="138" width="150" src="/userfiles/cd81c20268fd8f7940a41d19fd89aa01.jpg"
[2]=>
string(4) ".jpg"
}
|
Не совсем то, что мне нужно. Помогите пожалста с регулярным, или может быть есть другой способ выдернуть картинки из html? Буду очень признателен за совет. Спасибо.
Хотелось бы сразу сказать, что не идёт речь о краже контента или о чём-то незаконном. Одна фирма хочет организовать рассылку поздравительных открыток своим клиентам через html форму, парсить html мне нужно, чтобы оформить картинкикак вложения.
Для тех, кто скажет "если речь не идёт о чём-то незаконном, зачем ты пишешь об этом?", скажу, что на одном другом хорошем форуме закрыли мою тему, посчитав сабж обсуждением кражи контента | |
|
|
|
|
|
|
|
для: cjremix
(23.02.2009 в 00:57)
| | Сами пришли к выводу, что надо регулярка, а тему не там создали...
попробуйте так..
<?
$text = '
<p><img height="21" width="87" src="/userfiles/avavav.GIF" alt="" /></p>
<p><img height="138" width="150" src="/userfiles/cd81c20268fd8f7940a41d19fd89aa01.jpg" alt="" /></p>
';
preg_match_all("|src=\"(.*?)\"|is",$text,$links);//парс контента
unset($links[0]);//удаляем
//результат
echo '<pre>';
print_R($links);
echo '</pre>';
?>
|
| |
|
|
|
|
|
|
|
для: а-я
(23.02.2009 в 01:46)
| | Спасибо огромное - сработало на ура!! Я правда не очень понял, как влияет '?' и 'is' в регулярке. В статьях по выражениям тоже не нашёл. Не швырнёте в меня ссылкой? +) | |
|
|
|
|