Форум: Форум PHPФорум ApacheФорум Регулярные ВыраженияФорум MySQLHTML+CSS+JavaScriptФорум FlashРазное
Новые темы: 0000000
PHP Puzzles. Авторы: Кузнецов М.В., Симдянов И.В. MySQL 5. В подлиннике. Авторы: Кузнецов М.В., Симдянов И.В. Объектно-ориентированное программирование на PHP. Авторы: Кузнецов М.В., Симдянов И.В. C++. Мастер-класс в задачах и примерах. Авторы: Кузнецов М.В., Симдянов И.В. PHP. Практика создания Web-сайтов (второе издание). Авторы: Кузнецов М.В., Симдянов И.В.
ВСЕ НАШИ КНИГИ
Консультационный центр SoftTime

Форум Регулярные Выражения

Выбрать другой форум

 

Здравствуйте, Посетитель!

вид форума:
Линейный форум Структурный форум

тема: Позиции в Яндексе
 
 автор: black_joker   (24.09.2006 в 16:21)   письмо автору
 
 

Скачал скрипт определение позиций http://www.softtime.ru/info/glava15.php
но он не работает :(
помогите найти в нём ошибку
пологаю что обработка кода идёт в строке
   case YANDEX:
      return array("<LI value=\d{1,3}>\D*", "[^!]*<\/A>");

и
    case YANDEX:
      preg_match_all("/$startpattern.$site.$endpattern/iU",$text,$arr);
      preg_match_all("/\d{1,3}>/iU",$arr[0][0],$position);
$numberposition = substr($position[0][0], 0, strlen($position[0][0])-1);
      return $numberposition;


как изменить рег.. выражение под нынешний дизайн яндекса ?

   
 
 автор: Black_joker   (26.09.2006 в 02:10)   письмо автору
 
   для: black_joker   (24.09.2006 в 16:21)
 

что так никто и не поможет ?

   
 
 автор: cheops   (26.09.2006 в 11:28)   письмо автору
 
   для: black_joker   (24.09.2006 в 16:21)
 

Используйте обновлённую версию http://www.softtime.ru/info/monitoring.php.

   
 
 автор: Black_joker   (27.09.2006 в 22:47)   письмо автору
 
   для: cheops   (26.09.2006 в 11:28)
 

большое человеческое спасибо.
скачал новый скрипт
вчера всё работало хорошо, немного его подправил ещё.
но сегодня работать отказался ссылку на страницу яндекса показывает а саму позицию нет.
до этого стоял грабер позиций и за последнее время заметил, что работает только в определённое время. Также на форуме сёрдженжайн увидел что не только у меня такие проблемы. кажется яндекс начел борьбу со всякими сеомониторами и т.д

поэтому я решил использовать не основной домен yandex для парсинга а дополнительный который очень редко меняет дизайн. (http://large.yandex.ru/)

скажу сразу что я не спец рег выражениях но основы знаю.
из нового скрипта мониторинга немного не понятны мне рег выражение.

<li value=\"(?P<position>\d*)\">(\s*)<div([^>]*)>(\s*)<a([^>]*)", "([^>]*)><img([^>]*)><\/a>


поэтому вопрос что это за "<position>" и как он обрабатывается ? а также почему это [^>]*
внесено в скобки ?. на сколько я знаю скобки это запись в память или в масив не знаю как более точно выразится.

В общем попробовал изменить на

1) return "http://large.yandex.ru/search?unutf=da&page=$numberpage&query=$endstr";
2) return array("<LI value=([0-9]{1,3})>\s*<DIV[^>]*>\s*<A[^>]*", "[^>]*blank>");

но почему то не получается
а также скачанный скрипт не работает на локалке.

   
 
 автор: Black_joker   (29.09.2006 в 20:57)   письмо автору
 
   для: Black_joker   (27.09.2006 в 22:47)
 

видать слишком сложные вопросы задаю :)

   
 
 автор: cheops   (30.09.2006 в 12:01)   письмо автору
 
   для: Black_joker   (27.09.2006 в 22:47)
 

> что это за "<position>"
Это просто вхождение тэга <position> в текст

>а также почему это [^>]* внесено в скобки ?
иногда в скобки вносят фрагменты для удобства группировки, но вообще да, фрагменты в скобках запоминаются и могут быть извлечены позднее.

   
 
 автор: ЯR   (01.10.2006 в 02:42)   письмо автору
 
   для: cheops   (30.09.2006 в 12:01)
 

>> что это за "<position>"
> Это просто вхождение тэга <position> в текст
нет. это типа переменной в рег.выражениях.
называется именованный шаблон или что-то вроде.
так удобнее

> а также почему это [^>]* внесено в скобки ?
мне так удобнее

> а также скачанный скрипт не работает на локалке
??? с подключением к инету работает. Если по диалапу, то очень медленно.
Просто на серваках выделенный канал.

А вообще-то это лучше делать с помошью веб-служб.

   
Rambler's Top100
вверх

Rambler's Top100 Яндекс.Метрика Яндекс цитирования