Форум: Форум PHPФорум ApacheФорум Регулярные ВыраженияФорум MySQLHTML+CSS+JavaScriptФорум FlashРазное
Новые темы: 0000000
Социальная инженерия и социальные хакеры. Авторы: Кузнецов М.В., Симдянов И.В. Программирование. Ступени успешной карьеры. Авторы: Кузнецов М.В., Симдянов И.В. PHP 5/6. В подлиннике. Авторы: Кузнецов М.В., Симдянов И.В. Объектно-ориентированное программирование на PHP. Авторы: Кузнецов М.В., Симдянов И.В. Самоучитель MySQL 5. Авторы: Кузнецов М.В., Симдянов И.В.
ВСЕ НАШИ КНИГИ
Консультационный центр SoftTime

Форум Регулярные Выражения

Выбрать другой форум

 

Здравствуйте, Посетитель!

вид форума:
Линейный форум Структурный форум

тема: Взять только ссылки на сайте
 
 автор: Terri   (07.11.2006 в 10:43)   письмо автору
 
 

нужно со страници
http://www.irr.ru/communication/mobile/accessories/

взять только ссылки такого вида
http://www.irr.ru/communication/mobile/accessories/showAdvert,31882890,138,34.html
....

$pattern = '|<a href="(.*).html|isU';
preg_match_all($pattern, $contents, $matches_id, PREG_PATTERN_ORDER);
$matches_id = array_unique($matches_id[0]);

но почемуто неполучается

   
 
 автор: cheops   (07.11.2006 в 13:16)   письмо автору
 
   для: Terri   (07.11.2006 в 10:43)
 

Можно поступить следующимх образом
<?php
  $contents 
file_get_contents("http://www.irr.ru/communication/mobile/accessories/");

  
$pattern '|<a[\s]href="(http://www\.irr\.ru/communication/mobile/accessories(.*).html)|isU';
  
preg_match_all($pattern$contents$matches_id);
  echo 
"<pre>";
  
print_r($matches_id[1]);
  echo 
"</pre>";
?>

   
 
 автор: Terri   (07.11.2006 в 13:39)   письмо автору
 
   для: cheops   (07.11.2006 в 13:16)
 

cheops, спасибо большое, заработало

а можно ещё такой вопрос, сдесь уже конкретно этот адрес привязан к скрипту, а как можно нетолько этот раздел сайта но и любой другой существуюший, я сделал таким образом


  $pattern = '|<a[\s]href="(http://www\.irr\.ru/(.*).html)|isU';


тоесть всё что попадёт от "http://www.irr.ru/" и до ".html"

но у меня вываливается чутли не вся страница

   
 
 автор: cheops   (07.11.2006 в 14:01)   письмо автору
 
   для: Terri   (07.11.2006 в 13:39)
 

Это из-за того, что в тексте встречаются ссылки http://www.irr.ru, попробуйте следующее регулярное выражение
<?php
  $pattern 
'|<a[\s]href="(http://www\.irr\.ru/([^"]*).html)|isU';
?>

   
 
 автор: Terri   (07.11.2006 в 14:33)   письмо автору
 
   для: cheops   (07.11.2006 в 14:01)
 

во, теперь работает, токо правдо ещё попалась одна ссылка нета
http://www.irr.ru/changeRegion,,,34.html

но думаю непроблема, попробую отфильтровать чемнибудь

ну так спасибо большое :)

   
Rambler's Top100
вверх

Rambler's Top100 Яндекс.Метрика Яндекс цитирования