|
|
|
| Подскажите пожалуйста, каким образом можно проверить обновлена ли страница сайта или старая болтается? Как можно получить дату обновления страницы?
Как-то же роботы яндекса и др.поисковиков проверяют обновления страниц? | |
|
|
|
|
|
|
|
для: Alex Boxgorn
(11.06.2008 в 12:42)
| | В общем случае они ничего не проверяют, только сохраняют в своей базе хэш содержимого - если хэш поменялся - поменялась и страница. А то что они пишут про обновление, скорее соответствует времени посещения страницы поисковым роботом. | |
|
|
|
|
|
|
|
для: cheops
(12.06.2008 в 09:05)
| | Я правильно понял, поисковые сервера страницы скачивают 1 раз и записывают какую-то контрольную сумму сохраненной в базе страницы. И при проходе в интернете по сайтам, считают контрольныю сумму полученной в очередной раз страницы. Если сумма совподает, то заходим в следующий раз, не совпадает, обновляем страницу в базе и пишем новую контрольную сумму в базу.
Не подскажите какой алгоритм или какой функцией этот хэш считается? | |
|
|
|
|
|
|
|
для: alex boxgorn
(29.06.2008 в 06:52)
| | md5() | |
|
|
|
|
|
|
|
для: Alex Boxgorn
(11.06.2008 в 12:42)
| |
Заголовки If-Modified-Since и If-None-Match. Данные заголовки отправляются браузером при
обращении к странице, которая имеется в его кеше. Для правильной организации кеширования на
стороне клиента, серверному приложению необходимо отправлять заголовок «HTTP/1.0 304 Not
Modified» и прекращать передачу данных в случае, если содержимое запрашиваемой страницы не
изменилось с того момента времени, которое указано в присланном заголовке «If-Modified-Since».
|
| |
|
|
|
|
|
|
|
для: Alex Boxgorn
(11.06.2008 в 12:42)
| | Пользуйся технологией RSS | |
|
|
|