|
|
|
| Известна проблема с идексацией страниц, выдаваемых по запросу с передачей переменных. Почитав учебник Зеева Сураски и Леона Аткинсона, решили усовершенствовать движок. Пример на сайте http://5858088.ru. Раньше страницы формировались по запросу вида http://5858088.ru/index.php?px=3. Использовали переменную $_SERVER['PATH_INFO'] и адреса страниц приобрели вид http://5858088.ru/index.php/3.html, что, по книжке, должно было привести к индексации их как обычных html-страниц. Затем обнаружили, что приемлемым для сервера оказывается также путь без указания настоящего расширения - *.php: http://5858088.ru/index/3.html. В таком виде и прописали все ссылки.
(Получение переменной теперь выглядело так:
$px = str_replace('/', '', str_replace('.html', '', $_SERVER['PATH_INFO']));
|
).
А сегодня обнаружили, что Яндекс (который, к слову, нормально индексировал все страницы с "?" в URL), вообще не заметил всех документов, ссылки на которые были прописаны таким образом.
Вопросы:
1. Правы ли Аткинсон и Сураски? Т.е. действительно ли описанный механизм должен обеспечивать нормальную идексацию в поисковиках? По логике - кажется, да, но в чем тогда дело?
2.Может ли быть причиной то, что мы удалили из URL расширение *.php?
3.Хотелось бы узнать поподробней о том, как вообще осуществляется предоставление сервером документа по URL. Так, для меня стало откровением, что ссылка вида http://5858088.ru/index/3.html, где index выглядит, как папка, а на самом деле является php-документом, - может работать.
Большое спасибо всем ответившим. | |
|
|
|
|
|
|
|
для: ck
(17.05.2006 в 15:38)
| | 1. Это было справедливым некоторое время назад, сейчас роботы нормально разбирают строки с GET-параметрами и не считают их одной и той же страницей.
2. Скорее всего причина в том, что Яндекс не успел проиндексировать страницы - на это требуется время.
3. Это штучки Web-сервера, в частности модуля ReWrite, которому посвящена каждая вторая тема в разделе Apache. | |
|
|
|