Форум: Форум PHPФорум ApacheФорум Регулярные ВыраженияФорум MySQLHTML+CSS+JavaScriptФорум FlashРазное
Новые темы: 0000000
Самоучитель MySQL 5. Авторы: Кузнецов М.В., Симдянов И.В. PHP 5/6. В подлиннике. Авторы: Кузнецов М.В., Симдянов И.В. PHP на примерах (2 издание). Авторы: Кузнецов М.В., Симдянов И.В. Самоучитель PHP 5 / 6 (3 издание). Авторы: Кузнецов М.В., Симдянов И.В. MySQL 5. В подлиннике. Авторы: Кузнецов М.В., Симдянов И.В.
ВСЕ НАШИ КНИГИ
Консультационный центр SoftTime

Форум PHP

Выбрать другой форум

 

Здравствуйте, Посетитель!

вид форума:
Линейный форум Структурный форум

тема: Скрипты для чистки дублей
 
 автор: dump   (07.09.2009 в 12:04)   письмо автору
 
 

Может быть у кого-нибудь есть скрипты для чистки дублированных урл? Ну например чтобы достать их из .txt -файла потом, повторяющиеся очистить, оставить оригиналы, и оставить только домены.

  Ответить  
 
 автор: cheops   (07.09.2009 в 13:48)   письмо автору
 
   для: dump   (07.09.2009 в 12:04)
 

Пока не очень понятно, у вас есть пример файла, который нужно подвергнуть этой операции?

  Ответить  
 
 автор: dump   (10.09.2009 в 14:34)   письмо автору
 
   для: cheops   (07.09.2009 в 13:48)
 

Ну вот скажем у меня есть список урлов, например полученный из парсинга выдачи, и мне нужно получить из него список сайтов. Например:
Исходный список:
http://scienceblog.ru/
http://scienceblog.ru/2009/04/22/5-nauchnykh-fokusov-s-vodojj/
http://dxdt.ru/
http://amp3direct.org/
http://amp3direct.org/category/raznoe/

И конечный должен выглядеть так:

http://scienceblog.ru/
http://dxdt.ru/
http://amp3direct.org/

  Ответить  
 
 автор: Trianon   (10.09.2009 в 14:54)   письмо автору
 
   для: dump   (10.09.2009 в 14:34)
 

parse_url() и выборка по элементам 'host' в ключи массива.

  Ответить  
Rambler's Top100
вверх

Rambler's Top100 Яндекс.Метрика Яндекс цитирования