Форум: Форум PHPФорум ApacheФорум Регулярные ВыраженияФорум MySQLHTML+CSS+JavaScriptФорум FlashРазное
Новые темы: 0000000
Социальная инженерия и социальные хакеры. Авторы: Кузнецов М.В., Симдянов И.В. PHP 5. На примерах. Авторы: Кузнецов М.В., Симдянов И.В., Голышев С.В. Самоучитель PHP 5 / 6 (3 издание). Авторы: Кузнецов М.В., Симдянов И.В. PHP 5/6. В подлиннике. Авторы: Кузнецов М.В., Симдянов И.В. MySQL 5. В подлиннике. Авторы: Кузнецов М.В., Симдянов И.В.
ВСЕ НАШИ КНИГИ
Консультационный центр SoftTime

Форум Регулярные Выражения

Выбрать другой форум

 

Здравствуйте, Посетитель!

вид форума:
Линейный форум Структурный форум

тема: Давайте вместе сделаем толковый грабер новостей(не такой как уже обсуждали)
 
 автор: restall   (31.03.2006 в 21:47)   письмо автору
 
 

Здраствуйте, давайте вместе напиши ТОЛКОВЫЙ грабер НОРМАЛЬНЫХ новостей...
Вообщем есть сайт всем известен http://lenta.ru/
делаем вот такую хрень...
вот новости за сегодня http://lenta.ru/russia/2006/03/31/
Делаем переменные на категорию, год, месяц, число(чтобы потом можно было толково ходить по новосятм.. и просматривать их не толкько на даный день...)
Это не сложно...
Идем дальше...
нужно сграбить все новости по даной ссылке

<?
//Переменные для даты...
$cat;
$year;
$mon;
$day;

//теперь их нужно запузырить в урл наш)) http://lenta.ru/russia/2006/03/31/
$result file_get_contents("http://http://lenta.ru/".$cat."/".$year."/".$mon."/".$day."/");
//echo "$result";
//теперь нам нужно вытануть сами новости с заголовкамии описанием оть  сюда  <td class=news> по сюда </td>
//Я не оч. опытный,  новроде типа того
$array explode("<td class=\"news\">"$result); 
$arr explode("</td>"$array[1]); 
$links $arr[0]; 
//выводим
echo($links); 
?>

возможно скрипт то полность н епашет не проверял я его... но дело не вэтом.... это можно написать... помучаться чюток и написать можно...
теперь, люди, помогите розобраться.
Как сделать так, чтобы кликнув по ссылке новости ты не на тот сайт попадаешьь, а просто грабишь ту страницу, к которой ты запрос даешь...??
воще круто было бы. если это все сделать через крон... чтобы он запускался раз в час к примеру, и грабил весь текст главной ввесь текст новости, без всяких кодов, и вставлял хоть в базу мускул, хоть просто в файл...
Народ... если вы поняли про что я. то давайте вметсе напишим нормальный грабер...
Зарание большое СЕНКС!..
С ув. Андрей.

   
 
 автор: cheops   (01.04.2006 в 13:52)   письмо автору
 
   для: restall   (31.03.2006 в 21:47)
 

Смысла нет lenta.ru грабить :))) Если порыться на их сайте можно найти и новости в куче разных форматов (text, XML, RSS) плюс, скрипты на нескольких языках для их разбора.

   
 
 автор: restall   (01.04.2006 в 17:21)   письмо автору
 
   для: cheops   (01.04.2006 в 13:52)
 

Хм, ладно, пусть и так, а как тогда вытнуть акуратно новти с РСС. ВОт чтбы были и новти и описание, когда кликнул - описание?? и только на один еднь.. на текущий.. все остальные оставались в архиве а?

   
 
 автор: Лебедев Роман   (01.04.2006 в 19:35)   письмо автору
 
   для: cheops   (01.04.2006 в 13:52)
 

>Смысла нет lenta.ru грабить :)))

Всё уже украдено до нас! :))))
Я уже у себя на сайте их ворую.
http://roman.lebedev.com/news/

   
 
 автор: restall   (02.04.2006 в 11:52)   письмо автору
 
   для: Лебедев Роман   (01.04.2006 в 19:35)
 

Ну так поделись со мною))Если тебе не в ломы... Ты их грабишь с РСС или просто написал так грабер?

   
 
 автор: Лебедев Роман   (08.04.2006 в 19:23)   письмо автору
 
   для: restall   (02.04.2006 в 11:52)
 

>Ну так поделись со мною))Если тебе не в ломы... Ты их
>грабишь с РСС или просто написал так грабер?

Просто написал.
Чтобы лишний раз не таскать, сохраняю на сервере.

   
Rambler's Top100
вверх

Rambler's Top100 Яндекс.Метрика Яндекс цитирования