Форум: Форум PHPФорум ApacheФорум Регулярные ВыраженияФорум MySQLHTML+CSS+JavaScriptФорум FlashРазное
Новые темы: 0000000
PHP 5/6. В подлиннике. Авторы: Кузнецов М.В., Симдянов И.В. MySQL на примерах. Авторы: Кузнецов М.В., Симдянов И.В. Самоучитель PHP 5 / 6 (3 издание). Авторы: Кузнецов М.В., Симдянов И.В. Социальная инженерия и социальные хакеры. Авторы: Кузнецов М.В., Симдянов И.В. PHP на примерах (2 издание). Авторы: Кузнецов М.В., Симдянов И.В.
ВСЕ НАШИ КНИГИ
Консультационный центр SoftTime

Форум PHP

Выбрать другой форум

 

Здравствуйте, Посетитель!

вид форума:
Линейный форум Структурный форум

тема: Google как всегда приготовил сюрприз...
 
 автор: JIEXA   (05.06.2005 в 23:34)   письмо автору
 
 

Вот появилась https://www.google.com/webmasters/sitemaps/docs/en/protocol.html новая фишка у гугла. Всё что мне удалось узнать:

Google опубликовал материалы о специальном протоколе "sitemap" (карта сайта), призванном улучшить индексацию сайтов. "Карта" представляет собой специальный XML-файл определённого формата, в котором описываются страницы сайта, дата обновления, частота обновлений и приоритеты индексации. Файл следует располагать на сервере под именем sitemap.gz (сжатый GZIP). По утверждению разработчиков, данный протокол не является заменой существующих методов общения с поисковиками через robots.txt, а лишь дополняет их.

если кто знает как это делать скажите плиз, я к примеру нефига не понял :(

   
 
 автор: cheops   (06.06.2005 в 02:41)   письмо автору
 
   для: JIEXA   (05.06.2005 в 23:34)
 

ёклмн... не было печали... и ведь придётся делать, а то вдруг кто-нибудь сделает и обойдёт в плане раскрутки... Вроде всё прозрачно - создаётся XML-файл, каждой ссылке соотвествует карта
   <url>
      <loc>http://www.yoursite.com/</loc>
      <lastmod>2005-01-01</lastmod>
      <changefreq>monthly</changefreq>
      <priority>0.8</priority>
   </url>

<loc> - адрес
<lastmod> - время последней модификации
<changefreq> - частота изменения, для робота, как часто именяется информация:
"always" - всегда, например форум
"hourly" - ежечастно, например гостевая книга
"daily" - ежедневно, например, новости
"weekly" - еженедельно, например, анонсы
"monthly" - ежемесячно, например, ну я не знаю каталог продукции
"yearly" - ежегодно, главная страница сайта
"never" - никогда, посмотрел и забыл
<priority> - приоретет, от 0.0 (самый маленький) до 1.0 (самый большой)

PS Нужно будет почитать подробнее на свежую голову... хотя вопрос уже гложет, Google себя самым умным считает? Имеются стандарты - <META>-теги, которые для этого барахла и предназначены - чего огород городить, новые стандарты создавать... Заглохнет у них это начинание - нет я буду поддерживать отдельно стоящий файл для нескольких тысяч страниц форума - один раз его сгенерить можно, а при добалении новой темы тоже гененерить? Мне гораздо удобнее всё поместить в META-тэги. Хотя не спорю, поисковику, конечно удобнее взять из одного места, да ещё и в архив упакованный файл, но как бы разработчиков милионы, а Google один и технически проще закодировать один Google так чтобы он искал лучше новые страницы, а не милионам разработчиков усложнять организацию сайта.

   
 
 автор: Sfinks   (06.06.2005 в 04:30)   письмо автору
 
   для: cheops   (06.06.2005 в 02:41)
 

Пардон, я чет пропустил....
Про <META> обчитался, а про robots.txt?... Эт что?... С чем едят?..... Где почитать?.....

   
 
 автор: glsv (Дизайнер)   (06.06.2005 в 10:11)   письмо автору
 
   для: Sfinks   (06.06.2005 в 04:30)
 

robots.txt - это своеобразное джентльменское соглашение между роботами поисковых систем и web-мастерами. В нем можно попросить робота не лазить и не индексировать некоторые директории.

   
 
 автор: cheops   (06.06.2005 в 12:15)   письмо автору
 
   для: Sfinks   (06.06.2005 в 04:30)
 

О формате этого файла можно почитать в теме по ссылке http://www.softtime.ru/forum/read.php?id_forum=1&id_theme=3015

   
 
 автор: Sfinks   (06.06.2005 в 05:40)   письмо автору
 
   для: cheops   (06.06.2005 в 02:41)
 

> технически проще закодировать один Google так чтобы он искал
> лучше новые страницы, а не милионам разработчиков усложнять
> организацию сайта
А у Вас что, скрипт автоматом выбирает со страницы ключевые слова и для каждой темы генерит свой МЕТА-тег????!!!! :-/

   
 
 автор: glsv (Дизайнер)   (06.06.2005 в 10:07)   письмо автору
 
   для: Sfinks   (06.06.2005 в 05:40)
 

Отчасти это можно было бы сделать. Например, вставлять название страницы (темы) в мета-теги. Сейчас вставляется только в title.
Отчасти это реализовано в системе CMS. Там есть специальная форма для заполнения мета-тегов. Режим, правда, ручной.

Но сложность в другом. Когда делаешь страницу не очень трудно заполнить нужные мета-теги, так как "далеко ходить" не нужно. Когда же для этого нужно лезть в отдельный файл, притом немаленького размера и особенного формата – это менее удобно.

И совсем выпадают динамические страницы, взять тот же форум… При создании каждой новой темы перезаписывать этот самый файл? А вот сформировать автоматически title и мета-теги – запросто.

   
 
 автор: cheops   (06.06.2005 в 12:16)   письмо автору
 
   для: Sfinks   (06.06.2005 в 05:40)
 

Да в этом нет большой недобности, кто ж сейчас из роботов на МЕТА-теги смотрит...

   
 
 автор: Sergey89   (06.06.2005 в 12:59)   письмо автору
 
   для: cheops   (06.06.2005 в 12:16)
 

Кстати, а как лучше приоритеты выставлять?

   
 
 автор: cheops   (06.06.2005 в 13:11)   письмо автору
 
   для: Sergey89   (06.06.2005 в 12:59)
 

То, что вы считаете важным на сайте, должно получать приоретет 1, то что вам кажется менее важным - меньший. Поисковики группируют страницы и не показывают повторяющиеся страницы с вашего сайта. Поэтому часто в поисковик попадает захудалая страница, а та страница, на которую должен попасть пользователь, когда впервые обращается к вашему сайту не отражается в поисковой системе (ну или нужно включить режим отображения всех страниц, чтобы её найти). Приорететы позволят указать глупому роботу, что нужно отображать впервую очередь, а что во-вторую.

   
 
 автор: JIEXA   (06.06.2005 в 19:29)   письмо автору
 
   для: cheops   (06.06.2005 в 02:41)
 

Хороший ответ, а вот как бы это все авоматом можно сделать, как думаете? Тоесть к примеру у нас новостей 1800 примерно + версия для печати и версия для комментов,то это уже 1800x3 , мне руками это как то влом писать... Надо делать решение готовое, 100%

   
 
 автор: cheops   (06.06.2005 в 19:36)   письмо автору
 
   для: JIEXA   (06.06.2005 в 19:29)
 

Да в принципе тут только автоматом и можно сделать... наврное самое разумное написать что-то вроде мини-робота и заставить его обойти все страницы сайта - образовавшийся файл оставить на сайте и видоизменить скриты таким образом, чтобы при добавлении каждой новости они автоматом в этот скрипт записывали новую карту. Приходить время от времени (или поручить это cron) и сжимать файл при помощи gzip. Наверное можно это сделать, вопрос только в том стоит ли игра свечь и окупится ли наладка этого барахла и содержания лишнего (надо сказать отнюдь не маленького) файла на хосте?

   
 
 автор: JIEXA   (06.06.2005 в 20:04)   письмо автору
 
   для: cheops   (06.06.2005 в 19:36)
 

Да... ещё неизвестно будет ли гугл на него внимение обращать... Или вдруг что-то не так выйдет и он его не заметит... Для меня без проблем сделать скрипт который всю инфу из новостей возмет, для меня проблема заархировать его в gzip.

   
 
 автор: cheops   (06.06.2005 в 20:24)   письмо автору
 
   для: JIEXA   (06.06.2005 в 20:04)
 

Упаковать его не сложно - берём файл, читаем его во временную строку - запаковываем так как это описывается в теме по ссылке http://www.softtime.ru/forum/read.php?id_forum=1&id_theme=3788 и сохраняем в новый файл с расширением gz.

   
 
 автор: JIEXA   (06.06.2005 в 20:38)   письмо автору
 
   для: cheops   (06.06.2005 в 20:24)
 

а какое название у файла xml и tgz должно быть, чтобы гугл понял, что это для него приготовили :)?

   
 
 автор: cheops   (06.06.2005 в 22:21)   письмо автору
 
   для: JIEXA   (06.06.2005 в 20:38)
 

Так а вы же сами написали в первом посте - sitemap.gz в корне сайта.

   
Rambler's Top100
вверх

Rambler's Top100 Яндекс.Метрика Яндекс цитирования