Форум: Форум PHPФорум ApacheФорум Регулярные ВыраженияФорум MySQLHTML+CSS+JavaScriptФорум FlashРазное
Новые темы: 0000000
Программирование. Ступени успешной карьеры. Авторы: Кузнецов М.В., Симдянов И.В. MySQL 5. В подлиннике. Авторы: Кузнецов М.В., Симдянов И.В. Самоучитель MySQL 5. Авторы: Кузнецов М.В., Симдянов И.В. PHP Puzzles. Авторы: Кузнецов М.В., Симдянов И.В. PHP на примерах (2 издание). Авторы: Кузнецов М.В., Симдянов И.В.
ВСЕ НАШИ КНИГИ
Консультационный центр SoftTime

Форум Регулярные Выражения

Выбрать другой форум

 

Здравствуйте, Посетитель!

вид форума:
Линейный форум Структурный форум

тема: настройка выходного массива preg_match_all
 
 автор: maxnag   (11.07.2007 в 14:45)   письмо автору
 
 

Доброе время суток!
Подскажите решение следующей проблемы. Я сделал граббер вакансий одного сайта, на том сайте есть переменные поля, например поле зарплата, кто-то указывает её, а кто-то нет, когда я граббером прохожу, то получаю массив из трех ячеек (0 1 2), но откуда я знаю к какой записи принадлежит эта ячейка?!
Можно ли узнать как что и где? Из-за этого информация может быть сильно искажена.

результат граббера на сайте http://www.nagaychenko.com/

   
 
 автор: cheops   (12.07.2007 в 11:05)   письмо автору
 
   для: maxnag   (11.07.2007 в 14:45)
 

Неплохо увидеть само выражение... возможно у вас ячейки без зарплаты просто опускаются...

   
 
 автор: maxnag   (12.07.2007 в 11:41)   письмо автору
 
   для: cheops   (12.07.2007 в 11:05)
 


    preg_match_all("|<br>Минимальная[\s]зарплата[\s]\(в мес\.\)\:[\&\a-z\;\s]*<b>(.*)<\/b>|iU", $out['all_vak'], $out['min_zp']);
    echo'<pre>min_zp - ';print_r($out['min_zp']);echo'</pre>';


Всего на странице 10 объяв, и некоторые не содержат надписи "Минимальная зарплата ..." и следовательно регулярка вытаскивает всё где есть упоминание и нумерует по порядку.

Я вообще сделал обходной маневр, вначале я вырезал все 10 блоков, а потом работал над каждым, так всё получается как надо ( корректно формируется запрос ), но хотелось бы услышать есть ли другие способы решения.

PS Сайт я перезалил, поэтому на нем сейчас правильная работа.

   
Rambler's Top100
вверх

Rambler's Top100 Яндекс.Метрика Яндекс цитирования