яндекс XML

Главная страница

Создание сайтов

Блог Кузнецова М.В.

Статьи о PHP

PHP-скрипты

Статьи об Apache

Форум С++

Консультации

Форум "Про Жизнь"

Форум:	Форум PHP	Форум Apache	Форум Регулярные Выражения	Форум MySQL	HTML+CSS+JavaScript	Форум Flash	Разное
Новые темы:	0	0	0	0	0	0	0

Здравствуйте, Посетитель!

вид форума:

тема: яндекс XML

следующая тема

предыдущая тема

	автор: mirror (01.08.2006 в 12:02) письмо автору
	может у кого есть готовый скрипт для работы с эти сервесом: форма, отправка запроса и обработка результата? или хотя бы поясните, кто знает, как работает этот механизм.

	автор: Bronepoez[) (01.08.2006 в 13:46)
	для: mirror (01.08.2006 в 12:02)
	На офсайте есть. на яндексе где-то есть раздел документация. Вот то что у меня на винте есть: Сервер XML-поиска Яндекса принимает поисковые запросы методом POST или методом GET по адресу http://xmlsearch.yandex.ru/xmlsearch/. Во входном потоке должен быть передан поисковый запрос в формате XML. Входящий IP должен быть зарегистрирован в базе пользователей и предел числа запросов не должен быть превышен. Текущие ограничения: поисковых страниц в день не более 1000, групп на странице не более 20, документов в группе не более 3, пассажей в документе не более 5, длина запроса в символах не более 150, число страниц при листании не более 100. Структура поискового запроса <request> Поисковый запрос состоит из следующих элементов:<query> Текст запроса с учетом языка запросов Яндекса. Специальные символы в тексте запроса заменяйте на соответствующие escape-последовательности. Например, символ кавычек заменяйте на ", знак «<» на < и т.д. <sortby> Требуемая сортировка результатов поиска. Сортировка может быть только одна. <maxpassages> Число пассажей текста с найденными словами для каждого документа (не больше 5, по умолчанию — 2). <groupings> cписок запрошенных группировок, каждая из которых задается при помощи элемента <groupby>. Если группировки не заданы, то происходит «плоский» поиск (см. подробнее механизм группировок в поиске Яндекса). <page> Номер требуемой страницы при листании по страницам (по умолчанию — 0). Относится ко всем заданным группировкам. Для «широких» группировок (см. ниже) выдается всегда только первая страница найденного. <max-title-length> Максимальное количество символов в возвращаемом заголовке документа (title). Если заголовок длиннее, он «интеллектуально» обрезается до нужной длины. <max-headline-length> Максимальное количество символов в возвращаемой аннотации документа (headline). Если аннотация длиннее, она «интеллектуально» обрезается до нужной длины. <max-passage-length> Максимальное количество символов в возвращаемых пассажах документа (passages). Если какой-то из пассажей длиннее, он «интеллектуально» обрезается до нужной длины. <max-text-length> Максимальное количество символов в возвращаемых элементах страницы. Аналогично одновременному применению max-title-length, max-headline-length и max-passage-length с одинаковым ограничением по длине. Сортировка Яндекс может по-разному упорядочивать результаты поиска. По умолчанию при любой сортировке Яндекс учитывает «приоритет», то есть строгость соответствия документа запросу: «совпадение фразы», «наличие всех слов», «отсутствие некоторых слов». Результаты поиска разбиваются на три группы в соответствии с приоритетом и сортируются уже внутри каждой группы. <sortby> требуемая сортировка результатов поиска из списка допустимых сортировок.Режим сортировки задается в атрибутах элемента <sortby>: priority= учет приоритета совпадения с запросом при сортировке: «yes» — приоритет учитывается (по умолчанию), то есть сначала всегда идет буквальное совпадение с запросом, и т.д.; «no» — приоритет игнорируется. Группировка Яндекс ищет и находит отдельные документы, однако часто пользователю интересно изучать список найденного в сжатом виде, так, чтобы от каждой группы однородных документов был только один представитель. При желании можно получить только список групп, например, категорий Яндекс.Каталога без всяких документов. Для этих целей в Яндексе служит механизм группировки результатов. Группы упорядочиваются также, как их лучшие представители. Например, при сортировке по дате и одновременной группировке по сайтам в расчет принимается самый свежий документ сайта. Группировать результаты можно одновременно несколькими способами, например, можно получить список самых релевантных категорий каталога Яндекса и одновременно список найденных сайтов. Для этого надо перечислить в запросе все требуемые группировки. Яндекс поддерживает три способа группировки. Для того, чтобы получить несгруппированную выдачу служит «плоский» способ. Он считается заданным по умолчанию. В «плоском» случае каждая группа состоит ровно из одного документа. Группы могут образовывать иерархию (например, категории или регионы каталога Яндекса) или нет (например, веб-сайты). «Глубокий» способ группирует по самому нижнему уровню иерархии или по сайтам. Широкий способ позволяет группировать по категориям заданного уровня в нужной ветке иерархии. Задавать ветку следует при помощи номера узла (см. параметр curcateg), который можно узнать из результатов поиска, из элемента <categ id="">. <groupby> одна из требуемых группировок результатов поиска.Способ группировки описывается в атрибутах элемента <groupby>:attr= имя атрибута, по которыму происходит группировка. См. полный список группировок; mode= режим группировки: плоский (flat), глубокий (deep) или широкий (wide); groups-on-page= число групп на одной странице выдачи; docs-in-group= число документов в каждой группе; curcateg= номер узла иерархии, для которой следует показать "спектр" найденного. Значение по умолчанию -1 (глубокая группировка без иерархии, например веб-сайты). Корень иерархии всегда имеет номер 0.