|
|
|
| Скачал скрипт определение позиций http://www.softtime.ru/info/glava15.php
но он не работает :(
помогите найти в нём ошибку
пологаю что обработка кода идёт в строке
case YANDEX:
return array("<LI value=\d{1,3}>\D*", "[^!]*<\/A>");
|
и
case YANDEX:
preg_match_all("/$startpattern.$site.$endpattern/iU",$text,$arr);
preg_match_all("/\d{1,3}>/iU",$arr[0][0],$position);
$numberposition = substr($position[0][0], 0, strlen($position[0][0])-1);
return $numberposition;
|
как изменить рег.. выражение под нынешний дизайн яндекса ? | |
|
|
|
|
|
|
|
для: black_joker
(24.09.2006 в 16:21)
| | что так никто и не поможет ? | |
|
|
|
|
|
|
|
|
для: cheops
(26.09.2006 в 11:28)
| | большое человеческое спасибо.
скачал новый скрипт
вчера всё работало хорошо, немного его подправил ещё.
но сегодня работать отказался ссылку на страницу яндекса показывает а саму позицию нет.
до этого стоял грабер позиций и за последнее время заметил, что работает только в определённое время. Также на форуме сёрдженжайн увидел что не только у меня такие проблемы. кажется яндекс начел борьбу со всякими сеомониторами и т.д
поэтому я решил использовать не основной домен yandex для парсинга а дополнительный который очень редко меняет дизайн. (http://large.yandex.ru/)
скажу сразу что я не спец рег выражениях но основы знаю.
из нового скрипта мониторинга немного не понятны мне рег выражение.
<li value=\"(?P<position>\d*)\">(\s*)<div([^>]*)>(\s*)<a([^>]*)", "([^>]*)><img([^>]*)><\/a>
|
поэтому вопрос что это за "<position>" и как он обрабатывается ? а также почему это [^>]*
внесено в скобки ?. на сколько я знаю скобки это запись в память или в масив не знаю как более точно выразится.
В общем попробовал изменить на
1) return "http://large.yandex.ru/search?unutf=da&page=$numberpage&query=$endstr";
2) return array("<LI value=([0-9]{1,3})>\s*<DIV[^>]*>\s*<A[^>]*", "[^>]*blank>");
но почему то не получается
а также скачанный скрипт не работает на локалке. | |
|
|
|
|
|
|
|
для: Black_joker
(27.09.2006 в 22:47)
| | видать слишком сложные вопросы задаю :) | |
|
|
|
|
|
|
|
для: Black_joker
(27.09.2006 в 22:47)
| | > что это за "<position>"
Это просто вхождение тэга <position> в текст
>а также почему это [^>]* внесено в скобки ?
иногда в скобки вносят фрагменты для удобства группировки, но вообще да, фрагменты в скобках запоминаются и могут быть извлечены позднее. | |
|
|
|
|
|
|
|
для: cheops
(30.09.2006 в 12:01)
| | >> что это за "<position>"
> Это просто вхождение тэга <position> в текст
нет. это типа переменной в рег.выражениях.
называется именованный шаблон или что-то вроде.
так удобнее
> а также почему это [^>]* внесено в скобки ?
мне так удобнее
> а также скачанный скрипт не работает на локалке
??? с подключением к инету работает. Если по диалапу, то очень медленно.
Просто на серваках выделенный канал.
А вообще-то это лучше делать с помошью веб-служб. | |
|
|
|