|
|
|
| Здраствуйте, давайте вместе напиши ТОЛКОВЫЙ грабер НОРМАЛЬНЫХ новостей...
Вообщем есть сайт всем известен http://lenta.ru/
делаем вот такую хрень...
вот новости за сегодня http://lenta.ru/russia/2006/03/31/
Делаем переменные на категорию, год, месяц, число(чтобы потом можно было толково ходить по новосятм.. и просматривать их не толкько на даный день...)
Это не сложно...
Идем дальше...
нужно сграбить все новости по даной ссылке
<?
//Переменные для даты...
$cat;
$year;
$mon;
$day;
//теперь их нужно запузырить в урл наш)) http://lenta.ru/russia/2006/03/31/
$result = file_get_contents("http://http://lenta.ru/".$cat."/".$year."/".$mon."/".$day."/");
//echo "$result";
//теперь нам нужно вытануть сами новости с заголовкамии описанием оть сюда <td class=news> по сюда </td>
//Я не оч. опытный, новроде типа того
$array = explode("<td class=\"news\">", $result);
$arr = explode("</td>", $array[1]);
$links = $arr[0];
//выводим
echo($links);
?>
|
возможно скрипт то полность н епашет не проверял я его... но дело не вэтом.... это можно написать... помучаться чюток и написать можно...
теперь, люди, помогите розобраться.
Как сделать так, чтобы кликнув по ссылке новости ты не на тот сайт попадаешьь, а просто грабишь ту страницу, к которой ты запрос даешь...??
воще круто было бы. если это все сделать через крон... чтобы он запускался раз в час к примеру, и грабил весь текст главной ввесь текст новости, без всяких кодов, и вставлял хоть в базу мускул, хоть просто в файл...
Народ... если вы поняли про что я. то давайте вметсе напишим нормальный грабер...
Зарание большое СЕНКС!..
С ув. Андрей. | |
|
|
|
|
|
|
|
для: restall
(31.03.2006 в 21:47)
| | Смысла нет lenta.ru грабить :))) Если порыться на их сайте можно найти и новости в куче разных форматов (text, XML, RSS) плюс, скрипты на нескольких языках для их разбора. | |
|
|
|
|
|
|
|
для: cheops
(01.04.2006 в 13:52)
| | Хм, ладно, пусть и так, а как тогда вытнуть акуратно новти с РСС. ВОт чтбы были и новти и описание, когда кликнул - описание?? и только на один еднь.. на текущий.. все остальные оставались в архиве а? | |
|
|
|
|
|
|
|
для: cheops
(01.04.2006 в 13:52)
| | >Смысла нет lenta.ru грабить :)))
Всё уже украдено до нас! :))))
Я уже у себя на сайте их ворую.
http://roman.lebedev.com/news/ | |
|
|
|
|
|
|
|
для: Лебедев Роман
(01.04.2006 в 19:35)
| | Ну так поделись со мною))Если тебе не в ломы... Ты их грабишь с РСС или просто написал так грабер? | |
|
|
|
|
|
|
|
для: restall
(02.04.2006 в 11:52)
| | >Ну так поделись со мною))Если тебе не в ломы... Ты их
>грабишь с РСС или просто написал так грабер?
Просто написал.
Чтобы лишний раз не таскать, сохраняю на сервере. | |
|
|
|