|
|
|
| Всем привет! :)
Прошу помоч мне с написание регулярки для парсинга страницы.
Вобщем то вот пример страницы: http://apps.sdsheriff.net/warrant/waarAList.aspx?LastName=kr&FirstName=&Middle=&DOB=
Нужно выдернуть только таблицу с результатом поиска после надписи: Click on the same column heading a second time, the results will be sorted in descending order.
У меня с регулярками постоянные головняки! ((
И еще одна проблема...после того как я получу эту таблицу. мне нужно выдернуть все ссылки на страницы с инфой о человеке, которые присутствуют в этой таблице! Ссылка типа: http://apps.sdsheriff.net/warrant/waarDetail.aspx?RECD_NBR=152163
Заранее огроооооомнейшее спасибо за помощ! :) | |
|
|
|
|
|
|
|
для: CassIO
(30.07.2009 в 07:50)
| | зачем (!!!) использовать регулярные выражения там, где это не нужно?!!
не знаю, насколько часто там всё меняется, но гораздо быстрее:
$buf = file_get_contents('http://apps.sdsheriff.net/warrant/waarAList.aspx?LastName=kr&FirstName=&Middle=&DOB=');
$pos1 = strpos($buf, '<table cellspacing="2" cellpadding="3" rules="all"');
$pos2 = strpos($buf, '</table>', $pos1) + 8; // 8 — длина строки с </table>
$table = substr($buf, $pos1, $pos2 - $pos1);
|
| |
|
|
|