|
|
|
| нужно со страници
http://www.irr.ru/communication/mobile/accessories/
взять только ссылки такого вида
http://www.irr.ru/communication/mobile/accessories/showAdvert,31882890,138,34.html
....
$pattern = '|<a href="(.*).html|isU';
preg_match_all($pattern, $contents, $matches_id, PREG_PATTERN_ORDER);
$matches_id = array_unique($matches_id[0]);
но почемуто неполучается | |
|
|
|
|
|
|
|
для: Terri
(07.11.2006 в 10:43)
| | Можно поступить следующимх образом
<?php
$contents = file_get_contents("http://www.irr.ru/communication/mobile/accessories/");
$pattern = '|<a[\s]href="(http://www\.irr\.ru/communication/mobile/accessories(.*).html)|isU';
preg_match_all($pattern, $contents, $matches_id);
echo "<pre>";
print_r($matches_id[1]);
echo "</pre>";
?>
|
| |
|
|
|
|
|
|
|
для: cheops
(07.11.2006 в 13:16)
| | cheops, спасибо большое, заработало
а можно ещё такой вопрос, сдесь уже конкретно этот адрес привязан к скрипту, а как можно нетолько этот раздел сайта но и любой другой существуюший, я сделал таким образом
$pattern = '|<a[\s]href="(http://www\.irr\.ru/(.*).html)|isU';
|
тоесть всё что попадёт от "http://www.irr.ru/" и до ".html"
но у меня вываливается чутли не вся страница | |
|
|
|
|
|
|
|
для: Terri
(07.11.2006 в 13:39)
| | Это из-за того, что в тексте встречаются ссылки http://www.irr.ru, попробуйте следующее регулярное выражение
<?php
$pattern = '|<a[\s]href="(http://www\.irr\.ru/([^"]*).html)|isU';
?>
|
| |
|
|
|
|
|
|
|
для: cheops
(07.11.2006 в 14:01)
| | во, теперь работает, токо правдо ещё попалась одна ссылка нета
http://www.irr.ru/changeRegion,,,34.html
но думаю непроблема, попробую отфильтровать чемнибудь
ну так спасибо большое :) | |
|
|
|