|
|
|
| Здравствуйте...
Вообщем вопросик по парсингу сайтов:)
Допустим на сайте есть такое:
<a href="lala-471">Document 1</a><br/>
<a href="lala-4763">Document 2</a><br/>
<a href="lala-231">Document 3</a><br/>
|
Вообщем много ссылок на странице...
так вот как мне вывести эти ссылки и названия документов?
А то делаю вот так:
$ll = file_get_contents('url');
if(preg_match("#<a href=\"(.*)\">(.*)</a>#isU", $ll, $out))
echo $out[1]." >::::< "$out[2]."<br>";
|
так вот этим кодом выводит только первую ссылку и документ..
Хочу сделать все.....подскажите как?
Может оператором for или еще как-нить:) | |
|
|
|
|
|
|
|
для: SnooPI
(14.05.2007 в 19:21)
| | замените (.*) на (.*?) | |
|
|
|
|
|
|
|
для: SnooPI
(14.05.2007 в 19:21)
| | а)Вы неудачно выбрали разделитель столбиков при выводе. Он формирует теги, чего Вы от него не ожидаете.
б) Вы почему-то смотрите в браузер, в то время как нужно смотреть сгенерированный html-код.
<?php
//$ll = file_get_contents('url');
$ll = '<a href="lala-471">Document 1</a><br/>
<a href="lala-4763">Document 2</a><br/>
<a href="lala-231">Document 3</a><br/>';
if(preg_match_all("#<a href=\"(.*)\">(.*)</a>#i", $ll, $out, PREG_SET_ORDER))
foreach($out as $row) echo $row[1]." :::: ".$row[2]."<br>";
?>
|
| |
|
|
|
|
|
|
|
для: Trianon
(14.05.2007 в 19:34)
| | Спасибо работает, а как сделать чтобы эти сссылки у меня выводились норм, а не как ссылки?? Т.е. просто текстом ?:) | |
|
|
|
|
|
|
|
для: SnooPI
(14.05.2007 в 19:53)
| | а как они у Вас выводятся сейчас?
И почему название темы - file_get_contents? | |
|
|
|
|
|
|
|
для: SnooPI
(14.05.2007 в 19:53)
| | htmlspecialchars(); - Выведет просто HTML код. | |
|
|
|
|
|
|
|
для: Poison
(14.05.2007 в 22:09)
| | Все та проблема решена:)
Скажите пожалуйста...как сделать чтобы вывести не все ссылки на странице а первые допустим 5 ? | |
|
|
|