|
|
|
| Нужно выпарсить c помощью preg_match_all все ссылки с html страницы, которые начинаются с http:// и заканчиваются такими вариантами .jpg, .jpeg, .gif, .png, .css, .js.
Такие ссылки могут быть в src= и в href= могут иметь кавычки такие " или такие ' или их может и не быть вовсе.
Нужно учесть эти все моменты, т.к. страницы разные бывают.
Заранее спасибо огромное! | |
|
|
|
|
|
|
|
для: AlexDIXI
(18.06.2011 в 16:55)
| | >Такие ссылки могут быть в src= и в href=
А если ссылки находятся в другом месте их нужно игнорировать? | |
|
|
|
|
|
|
|
для: cheops
(18.06.2011 в 17:34)
| | Можно везде.. Я привел пример с href и src..
Помогите очень надо пожалуйста.. | |
|
|
|
|
|
|
|
для: AlexDIXI
(18.06.2011 в 21:01)
| | Можно начать отталкиваться от следующего регулярного выражения
#http://(.*?)\.(jpg|jpeg|gif|png|css|js)#is
|
| |
|
|
|
|
|
|
|
для: cheops
(18.06.2011 в 21:37)
| | Вот пример что-то ваш паттерн не работает..
<?
$html = file_get_contents("http://alexwm.com/admingal/pars/test.php");
preg_match_all('#http://(.*?)\.(jpg|jpeg|gif|png|css|js)#is', $html, $out);
print_r($out);
?>
|
| |
|
|
|
|
|
|
|
для: AlexDIXI
(18.06.2011 в 21:58)
| | Поправьте скрипт следующим образом
<?php
$html = file_get_contents("http://alexwm.com/admingal/pars/test.php");
preg_match_all('#http://(?:[^\'"]*?)\.(?:jpg|jpeg|gif|png|css|js)#is', $html, $out);
echo "<pre>";
print_r($out);
echo "</pre>";
?>
|
| |
|
|
|
|
|
|
|
для: cheops
(18.06.2011 в 22:23)
| | Ага теперь отработало как и ожидал. Спасибо за Ваш труд! | |
|
|
|