|
|
|
| Доброе время суток!
Подскажите решение следующей проблемы. Я сделал граббер вакансий одного сайта, на том сайте есть переменные поля, например поле зарплата, кто-то указывает её, а кто-то нет, когда я граббером прохожу, то получаю массив из трех ячеек (0 1 2), но откуда я знаю к какой записи принадлежит эта ячейка?!
Можно ли узнать как что и где? Из-за этого информация может быть сильно искажена.
результат граббера на сайте http://www.nagaychenko.com/ | |
|
|
|
|
|
|
|
для: maxnag
(11.07.2007 в 14:45)
| | Неплохо увидеть само выражение... возможно у вас ячейки без зарплаты просто опускаются... | |
|
|
|
|
|
|
|
для: cheops
(12.07.2007 в 11:05)
| |
preg_match_all("|<br>Минимальная[\s]зарплата[\s]\(в мес\.\)\:[\&\a-z\;\s]*<b>(.*)<\/b>|iU", $out['all_vak'], $out['min_zp']);
echo'<pre>min_zp - ';print_r($out['min_zp']);echo'</pre>';
|
Всего на странице 10 объяв, и некоторые не содержат надписи "Минимальная зарплата ..." и следовательно регулярка вытаскивает всё где есть упоминание и нумерует по порядку.
Я вообще сделал обходной маневр, вначале я вырезал все 10 блоков, а потом работал над каждым, так всё получается как надо ( корректно формируется запрос ), но хотелось бы услышать есть ли другие способы решения.
PS Сайт я перезалил, поэтому на нем сейчас правильная работа. | |
|
|
|