Форум: Форум PHPФорум ApacheФорум Регулярные ВыраженияФорум MySQLHTML+CSS+JavaScriptФорум FlashРазное
Новые темы: 0000000
PHP 5. На примерах. Авторы: Кузнецов М.В., Симдянов И.В., Голышев С.В. MySQL на примерах. Авторы: Кузнецов М.В., Симдянов И.В. Объектно-ориентированное программирование на PHP. Авторы: Кузнецов М.В., Симдянов И.В. PHP. Практика создания Web-сайтов (второе издание). Авторы: Кузнецов М.В., Симдянов И.В. Самоучитель PHP 5 / 6 (3 издание). Авторы: Кузнецов М.В., Симдянов И.В.
ВСЕ НАШИ КНИГИ
Консультационный центр SoftTime

Форум Регулярные Выражения

Выбрать другой форум

 

Здравствуйте, Посетитель!

вид форума:
Линейный форум Структурный форум

тема: Парсинг и разбор поисковиков. Часть 2.
 
 автор: Shorr Kan   (11.09.2005 в 19:24)   письмо автору
 
 

Итак. Мне совершенно неясно, в каких случаях в поисковиках задается link:http://www.site.com , в каких - link:www.site.com , а в каких - link:site.com . Та же проблема и с оператором site:
Для ее решения я нашел только один вариант - делать все три запроса. Как их сделать компактно и экономично? Компактно - в смысле кода, а то мусора много получается. Хотелось бы результат получить в едином массиве. Экономично - это уже про скорость. Чтобы не ждать полчаса...
Человек должен задавать свой сайт, поисковый запрос и глубину поиска. Должно происходить три вещи - выясняться количество проиндексированных страничек (оператор site: ... но с протоколом, без него... с/без www - я не знаю, поэтому - все три варианта. Или есть какой-то стандарт на такие запросы, о котором я не знаю?). Второе - выясняться количество ссылающихся страничек (оператор link: . Проблема с http и www - та же.). Третье - собирается массив выдачи (если человек дал глубину поиска - 100 сайтов, то в массив берутся первые 100 сайтов по этому запросу, т.е., с первых 10 страниц выдачи в поисковике) и в нем ищется сайт человека. Если найдет - пишется позиция. Если нет - пишется... что-нибудь.

Эээ... я понятно выразил? А то много чего-то...

   
 
 автор: cheops   (11.09.2005 в 23:50)   письмо автору
 
   для: Shorr Kan   (11.09.2005 в 19:24)
 

Погодите... а нельзя в момент ввода этого самого "link:www.site.com" проверять есть ли в введённой фразе http://, www и т.д. - ведь это можно сделать даже при помощи стрковых функций. Не очень понятно зачем осуществляются все три запроса...

   
 
 автор: Shorr Kan   (12.09.2005 в 02:00)   письмо автору
 
   для: cheops   (11.09.2005 в 23:50)
 

Нет, дело вот в чем - ввести-то можно с http://... без него... Но как правильно для того, чтобы найти сайт в поисковике? Это вообще неясно. Впрочем, это можно оставить на самого пользователя. Ввел с http:// - значит в лоб будем искать с ним.
Просто я хотел улучшить этот процесс. Вы попробуйте всеми тремя вариантами сайт найти - разные результаты.

   
 
 автор: cheops   (12.09.2005 в 02:28)   письмо автору
 
   для: Shorr Kan   (12.09.2005 в 02:00)
 

Вы лучше текстом об этом пользователей вашего сервиса предупредите... они сами три раза запрос выполнят, если им нужно будет, а вам хиты :)))

   
Rambler's Top100
вверх

Rambler's Top100 Яндекс.Метрика Яндекс цитирования