|
|
|
| Есть текст на странице и надо из строчки вытащить все URL
У меня что-то коряво получается, уверен должны быть пути проще.
Хоть какую идею киньте
К примеру, такой текст (ссылки все внутренние)
Интернет-поисковик подвел итоги 2013 года, назвав самые популярные темы, исходя из поисковых запросов. Главными событиями года по версии компании стали <a href=met.html target=_blank>падение метеорита</a> в Челябинске и <a href=chel.html target=_blank>развод Владимира и Людмилы Путиных</a>, а также <a href=sur.html target=_blank>рождение суррогатных детей</a>.
Полковник Мяу, Сердитый Кот и другие популярные среди интернет-пользователей кошки представили свой рождественский видеоклип, снятый в благотворительных целях, сообщает в среду газета <a href="latimes.php" target="_blank">Los Angeles Times</a>. | |
|
|
|
|
|
|
|
для: simplyv
(12.12.2013 в 12:16)
| | сразу есть 2 идеи, если подумать может больше:
1) preg_match_all + регулярка
2) представить текст как html - частный случай xml и распарсить его | |
|
|
|
|
|
|
|
для: simplyv
(12.12.2013 в 12:16)
| | http://www.softtime.ru/forum/read.php?id_forum=6&id_theme=90568#post538819 Вот тут примеры регулярок, только нужно будет их под себя приспособить
либо http://simplehtmldom.sourceforge.net/, если только для вытаскивания ссылок, второй вариант проще и быстрее. | |
|
|
|