Форум: Форум PHPФорум ApacheФорум Регулярные ВыраженияФорум MySQLHTML+CSS+JavaScriptФорум FlashРазное
Новые темы: 0000000
C++. Мастер-класс в задачах и примерах. Авторы: Кузнецов М.В., Симдянов И.В. MySQL 5. В подлиннике. Авторы: Кузнецов М.В., Симдянов И.В. PHP на примерах (2 издание). Авторы: Кузнецов М.В., Симдянов И.В. Самоучитель PHP 5 / 6 (3 издание). Авторы: Кузнецов М.В., Симдянов И.В. Самоучитель MySQL 5. Авторы: Кузнецов М.В., Симдянов И.В.
ВСЕ НАШИ КНИГИ
Консультационный центр SoftTime

Форум PHP

Выбрать другой форум

 

Здравствуйте, Посетитель!

вид форума:
Линейный форум Структурный форум

тема: Несколько идей по созданию граббера новостей
 
 автор: fis   (30.04.2007 в 18:21)   письмо автору
 
 

Пробую сделать новостной граббер - примерно из 130 каналов буду собирать новости.
Есть несколько проблем:
1. Каким образом можно определять схожие статьи, например можно использовать функцию similar_text. Это самый простой способ, но может быть есть еще способы для сравнения обьемных строк?
2. Где лучше хранить новости? В базе данных, или делать для каждой категории каталог, и записывать туда файлы вида 12345_news.htm и одновременно заносить инфу о файле в базу?

   
 
 автор: bronenos   (30.04.2007 в 18:34)   письмо автору
 
   для: fis   (30.04.2007 в 18:21)
 

ищите ключевые слова вроде спорт, футбол, мобильные и на их основе рассовываете по категориям... а насчет хранения - однозначно, базу!

   
 
 автор: fis   (30.04.2007 в 18:35)   письмо автору
 
   для: bronenos   (30.04.2007 в 18:34)
 

Не это понятно, вопрос в том чтобы найти одинаковые по смыслу статьи с разных источников.

   
 
 автор: ddhvvn   (30.04.2007 в 18:56)   письмо автору
 
   для: fis   (30.04.2007 в 18:35)
 

-

   
Rambler's Top100
вверх

Rambler's Top100 Яндекс.Метрика Яндекс цитирования