Форум: Форум PHPФорум ApacheФорум Регулярные ВыраженияФорум MySQLHTML+CSS+JavaScriptФорум FlashРазное
Новые темы: 0000000
Самоучитель PHP 5 / 6 (3 издание). Авторы: Кузнецов М.В., Симдянов И.В. PHP 5/6. В подлиннике. Авторы: Кузнецов М.В., Симдянов И.В. Объектно-ориентированное программирование на PHP. Авторы: Кузнецов М.В., Симдянов И.В. Программирование. Ступени успешной карьеры. Авторы: Кузнецов М.В., Симдянов И.В. PHP на примерах (2 издание). Авторы: Кузнецов М.В., Симдянов И.В.
ВСЕ НАШИ КНИГИ
Консультационный центр SoftTime

Разное

Выбрать другой форум

 

Здравствуйте, Посетитель!

вид форума:
Линейный форум Структурный форум

тема: как сказать роботу, что три разные ссылки- одна и таже страница и чтоб в индекс попала только 1
 
 автор: ladan   (10.06.2012 в 20:33)   письмо автору
 
 

Добрый вечер! Название темы- есть вопрос.

К примеру у меня есть такие ссылки:

http://sait.ru/avto/
http://sait.ru/avto/page-1/
http://sait.ru/avto/page-1/?ORDER_BY=date_DESC

Нужно, чтоб робот как-то их склеивал и в индекс попадала только http://sait.ru/avto/.

Правильно ли поступить так:

в robots.txt

Disallow: /avto/page-1/* 


?

  Ответить  
 
 автор: Может канонический url прописать странице   (10.06.2012 в 20:39)
 
   для: ladan   (10.06.2012 в 20:33)
 

Может канонический url прописать странице

  Ответить  
 
 автор: ladan   (10.06.2012 в 21:02)   письмо автору
 
   для: Может канонический url прописать странице   (10.06.2012 в 20:39)
 

интересный атрибут, только смутило это :
документ не может иметь несколько канонических url;
http://help.yandex.ru/webmaster/?id=1111858

У меня в хедаре меню много ссылок, типа:

site.ru/avto/
site.ru/images/

перейдя по ним, стоит постраничная навигация и сортировка (по дате, по популярности)

Это если им дать канонический url... то это будет больше чем 1 на странице..

Надеюсь проблему можно будет решить через robots.txt

  Ответить  
 
 автор: Владимир55   (10.06.2012 в 22:06)   письмо автору
 
   для: ladan   (10.06.2012 в 20:33)
 

Если Вам нужно, что бы в индекс попадала только http://sait.ru/avto/, то на всех других страницах пишете
<link rel="canonical" href="http://sait.ru/avto/"/>


Но вообще, хотя такую конструкцию поисковики допускают, не надо иметь страницы с разными адресами, но с одинаковым контентом.

  Ответить  
 
 автор: ladan   (10.06.2012 в 22:50)   письмо автору
 
   для: Владимир55   (10.06.2012 в 22:06)
 

у меня просто на первой странице http://sait.ru/avto/ есть ссылки с сортировкой по дате и тп.:
http://sait.ru/avto/?ORDER_BY=date_DESC
 http://sait.ru/avto/?ORDER_BY=date_ASC
  http://sait.ru/avto/?ORDER_BY=rating_DESC
 http://sait.ru/avto/?ORDER_BY=rating_ASC.

Получается что робот сначала прочтет в хедаре http://sait.ru/avto/, а потом пойдет по http://sait.ru/avto/?ORDER_BY=date_DESC и наделает дублей... и это все на одной странице. Просто может в robots.txt прописать те ссылки, которые не нужно посещать? (мне бы так удобнее было).

Я в первом посту указал пример(правильный ли?) как нужно указывать запрет на "ненужные ссылки"

  Ответить  
 
 автор: Владимир55   (11.06.2012 в 00:32)   письмо автору
 
   для: ladan   (10.06.2012 в 22:50)
 

Звездочка не обязательна - она приписывается по умолчанию.

Таким образом Вы закрыли от индексации все 4 варианта этой страницы. Если же один из них хотите допустить к индексации, то можете перечислить те, что надо закрыть:

Disallow:  /avto/?ORDER_BY=date_ASC 
Disallow: /avto/?ORDER_BY=rating_DESC 
Disallow: /avto/?ORDER_BY=rating_ASC


Или так:
Disallow: /avto/
Allow: /avto/?ORDER_BY=date_DESC 

  Ответить  
 
 автор: jo   (10.06.2012 в 23:36)
 
   для: ladan   (10.06.2012 в 20:33)
 

>Правильно ли поступить так?
Нет.

У Вас же, как я понимаю имеется и страница /avto/page-2/ и т.д. у которых тоже есть фильтр по дате

Если Вам нужно, чтобы в поиске была только /avto/

То
Disallow: /avto/*
но тогда Вы теряете стр 1 2 3 и т.д.

  Ответить  
 
 автор: ladan   (11.06.2012 в 00:20)   письмо автору
 
   для: jo   (10.06.2012 в 23:36)
 

а если блок с фильтрами поместить в тег noindex, а в его ссылках указать rel="nofollow"?
А в robots.txt прописать
Disallow: /avto/page-1


И вроде бы дублей не будет.. В поиске тогда будут
http://sait.ru/avto/
 http://sait.ru/avto/page-2/
 http://sait.ru/avto/page-3/
и тп


Поправьте плиз, если что не так

  Ответить  
 
 автор: jo   (11.06.2012 в 00:31)
 
   для: ladan   (11.06.2012 в 00:20)
 

Непонятно почему Вы закрываете только /avto/page-1 или это только пример? Если пример, то неясно, как другие закрывать 123.... 1 000 000 Хотя думаю, что это не планируется)

  Ответить  
 
 автор: ladan   (11.06.2012 в 01:15)   письмо автору
 
   для: jo   (11.06.2012 в 00:31)
 

как другие закрывать 123.... 1 000 000


Это вы про страницы? Их не нужно закрывать..

У меня на http://sait.ru/avto/page-2/ или http://sait.ru/avto/page-3/ будет совсем другой контент и его нужно будет проиндексировать, точнее ссылки... Также как и http://sait.ru/avto/ и http://sait.ru/avto/page-1/, но здесь будет один и тот же контент и придется закрыть доступ к /avto/page-1

Вот у меня ситуацию как и у этого сайта

Есть такая ссылка

http://softtime.ru/forum/index.php?page=1&id_forum=1 и такая 
http://softtime.ru/forum/index.php?id_forum=1


Если робот умеет сканировать в обратную сторону, то он обнаружит дубль :)

  Ответить  
 
 автор: jo   (11.06.2012 в 01:58)
 
   для: ladan   (11.06.2012 в 01:15)
 

Так какой же тут дубль?
Есть форум 1 у него имеется стр.1, есть форум 2 у него тоже есть стр. 1

  Ответить  
 
 автор: ladan   (11.06.2012 в 02:16)   письмо автору
 
   для: jo   (11.06.2012 в 01:58)
 

Робот ведь заходит на главную
http://softtime.ru/
в правой части выбирает форум ссылкой http://softtime.ru/forum/index.php?id_forum=2, а потом оказывается, что такая же страница существует с ссылкой http://softtime.ru/forum/index.php?page=1&id_forum=2. Я не знаю какие штрафы роботы за это дают.. может у меня понятия в дублях страниц немного другие :)

  Ответить  
 
 автор: jo   (11.06.2012 в 11:06)
 
   для: ladan   (11.06.2012 в 02:16)
 

Тогда закрываете index.php?page=1&id_forum=2 и живете спокойно)

  Ответить  
 
 автор: ladan   (11.06.2012 в 16:10)   письмо автору
 
   для: jo   (11.06.2012 в 11:06)
 

спс!

  Ответить  
 
 автор: jo   (11.06.2012 в 00:36)
 
   для: ladan   (11.06.2012 в 00:20)
 

Возможно Вам пойдет такая запись. Но не уверен.

Disallow: /avto/?*

  Ответить  
 
 автор: ladan   (11.06.2012 в 18:48)   письмо автору
 
   для: jo   (11.06.2012 в 00:36)
 

а нормально, что на одну страницу может быть 3-4 одинаковых ссылки?

У меня в цикле выводятся блоки <div>, в каждом есть title ссылка на полную версию статьи, ниже число комментариев с такой же ссылкой и мини фото с ссылкой

  Ответить  
 
 автор: jo   (13.06.2012 в 18:59)
 
   для: ladan   (11.06.2012 в 18:48)
 

Да вроде бы нет в этом ничего плохого...

  Ответить  
Rambler's Top100
вверх

Rambler's Top100 Яндекс.Метрика Яндекс цитирования