Форум: Форум PHPФорум ApacheФорум Регулярные ВыраженияФорум MySQLHTML+CSS+JavaScriptФорум FlashРазное
Новые темы: 0000000
Самоучитель MySQL 5. Авторы: Кузнецов М.В., Симдянов И.В. PHP Puzzles. Авторы: Кузнецов М.В., Симдянов И.В. Программирование. Ступени успешной карьеры. Авторы: Кузнецов М.В., Симдянов И.В. PHP. Практика создания Web-сайтов (второе издание). Авторы: Кузнецов М.В., Симдянов И.В. PHP на примерах (2 издание). Авторы: Кузнецов М.В., Симдянов И.В.
ВСЕ НАШИ КНИГИ
Консультационный центр SoftTime

Разное

Выбрать другой форум

 

Здравствуйте, Посетитель!

вид форума:
Линейный форум Структурный форум

тема: яндекс XML
 
 автор: mirror   (01.08.2006 в 12:02)   письмо автору
 
 

может у кого есть готовый скрипт для работы с эти сервесом: форма, отправка запроса и обработка результата? или хотя бы поясните, кто знает, как работает этот механизм.

   
 
 автор: Bronepoez[)   (01.08.2006 в 13:46)
 
   для: mirror   (01.08.2006 в 12:02)
 

На офсайте есть.

на яндексе где-то есть раздел документация.

Вот то что у меня на винте есть:

Сервер XML-поиска Яндекса принимает поисковые запросы методом POST или методом GET по адресу http://xmlsearch.yandex.ru/xmlsearch/. Во входном потоке должен быть передан поисковый запрос в формате XML. Входящий IP должен быть зарегистрирован в базе пользователей и предел числа запросов не должен быть превышен.
Текущие ограничения: поисковых страниц в день не более 1000, групп на странице не более 20, документов в группе не более 3, пассажей в документе не более 5, длина запроса в символах не более 150, число страниц при листании не более 100.
Структура поискового запроса
<request> Поисковый запрос состоит из следующих элементов:<query> Текст запроса с учетом языка запросов Яндекса. Специальные символы в тексте запроса заменяйте на соответствующие escape-последовательности. Например, символ кавычек заменяйте на &quot;, знак «<» на &lt; и т.д.

<sortby> Требуемая сортировка результатов поиска. Сортировка может быть только одна.

<maxpassages> Число пассажей текста с найденными словами для каждого документа (не больше 5, по умолчанию — 2).

<groupings> cписок запрошенных группировок, каждая из которых задается при помощи элемента <groupby>. Если группировки не заданы, то происходит «плоский» поиск (см. подробнее механизм группировок в поиске Яндекса).

<page> Номер требуемой страницы при листании по страницам (по умолчанию — 0). Относится ко всем заданным группировкам. Для «широких» группировок (см. ниже) выдается всегда только первая страница найденного.

<max-title-length> Максимальное количество символов в возвращаемом заголовке документа (title). Если заголовок длиннее, он «интеллектуально» обрезается до нужной длины.

<max-headline-length> Максимальное количество символов в возвращаемой аннотации документа (headline). Если аннотация длиннее, она «интеллектуально» обрезается до нужной длины.

<max-passage-length> Максимальное количество символов в возвращаемых пассажах документа (passages). Если какой-то из пассажей длиннее, он «интеллектуально» обрезается до нужной длины.

<max-text-length> Максимальное количество символов в возвращаемых элементах страницы. Аналогично одновременному применению max-title-length, max-headline-length и max-passage-length с одинаковым ограничением по длине.




Сортировка
Яндекс может по-разному упорядочивать результаты поиска. По умолчанию при любой сортировке Яндекс учитывает «приоритет», то есть строгость соответствия документа запросу: «совпадение фразы», «наличие всех слов», «отсутствие некоторых слов». Результаты поиска разбиваются на три группы в соответствии с приоритетом и сортируются уже внутри каждой группы.
<sortby> требуемая сортировка результатов поиска из списка допустимых сортировок.Режим сортировки задается в атрибутах элемента <sortby>:
priority= учет приоритета совпадения с запросом при сортировке: «yes» — приоритет учитывается (по умолчанию), то есть сначала всегда идет буквальное совпадение с запросом, и т.д.; «no» — приоритет игнорируется.




Группировка
Яндекс ищет и находит отдельные документы, однако часто пользователю интересно изучать список найденного в сжатом виде, так, чтобы от каждой группы однородных документов был только один представитель. При желании можно получить только список групп, например, категорий Яндекс.Каталога без всяких документов. Для этих целей в Яндексе служит механизм группировки результатов.
Группы упорядочиваются также, как их лучшие представители. Например, при сортировке по дате и одновременной группировке по сайтам в расчет принимается самый свежий документ сайта.
Группировать результаты можно одновременно несколькими способами, например, можно получить список самых релевантных категорий каталога Яндекса и одновременно список найденных сайтов. Для этого надо перечислить в запросе все требуемые группировки.
Яндекс поддерживает три способа группировки. Для того, чтобы получить несгруппированную выдачу служит «плоский» способ. Он считается заданным по умолчанию. В «плоском» случае каждая группа состоит ровно из одного документа.
Группы могут образовывать иерархию (например, категории или регионы каталога Яндекса) или нет (например, веб-сайты). «Глубокий» способ группирует по самому нижнему уровню иерархии или по сайтам. Широкий способ позволяет группировать по категориям заданного уровня в нужной ветке иерархии. Задавать ветку следует при помощи номера узла (см. параметр curcateg), который можно узнать из результатов поиска, из элемента <categ id="">.
<groupby> одна из требуемых группировок результатов поиска.Способ группировки описывается в атрибутах элемента <groupby>:attr= имя атрибута, по которыму происходит группировка. См. полный список группировок;

mode= режим группировки: плоский (flat), глубокий (deep) или широкий (wide);

groups-on-page= число групп на одной странице выдачи;

docs-in-group= число документов в каждой группе;

curcateg= номер узла иерархии, для которой следует показать "спектр" найденного. Значение по умолчанию -1 (глубокая группировка без иерархии, например веб-сайты). Корень иерархии всегда имеет номер 0.

   
Rambler's Top100
вверх

Rambler's Top100 Яндекс.Метрика Яндекс цитирования