Форум: Форум PHPФорум ApacheФорум Регулярные ВыраженияФорум MySQLHTML+CSS+JavaScriptФорум FlashРазное
Новые темы: 0000000
PHP 5. На примерах. Авторы: Кузнецов М.В., Симдянов И.В., Голышев С.В. Программирование. Ступени успешной карьеры. Авторы: Кузнецов М.В., Симдянов И.В. Самоучитель MySQL 5. Авторы: Кузнецов М.В., Симдянов И.В. MySQL 5. В подлиннике. Авторы: Кузнецов М.В., Симдянов И.В. PHP 5/6. В подлиннике. Авторы: Кузнецов М.В., Симдянов И.В.
ВСЕ НАШИ КНИГИ
Консультационный центр SoftTime

Форум Регулярные Выражения

Выбрать другой форум

 

Здравствуйте, Посетитель!

вид форума:
Линейный форум Структурный форум

тема: Парсинг сайта
 
 автор: lepelka   (01.11.2008 в 00:08)   письмо автору
 
 

Здравствуйте! При написании регулярки для парсинга сайта возникла трудность
необходимо вырезать кусок сайта:
от <div id="body" class="module"> до <div style="margin-left: 20px;">

Во время разработки сохранил указанную страницу на локальный сервер и добился необходимого результата (выводит всё, что надо).
Но, как только запустил обработку страницы в интернете - всё перестало работать
(выводит пустую страницу)
Подскажите, где искать решение

<?php 
  
if ($res implode(''file("http://weather.tut.by/city/26659.html"))) 
  {
preg_match("|<div id=\"body\" class=\"module\">(.*)<div style=\"margin-left: 20px;\">|is"$res$out);
     echo 
$out[1];
   }else{ 
 print 
"нет соединения с сервером ";

?>

  Ответить  
 
 автор: BinLaden   (01.11.2008 в 01:08)   письмо автору
 
   для: lepelka   (01.11.2008 в 00:08)
 

На той странице нет ни
<div id="body" class="module">
, ни
<div style="margin-left: 20px;">
. Впрочем, там есть
<div id=body class=module>
Но эти строки, как Вы понимаете, разные.

  Ответить  
 
 автор: lepelka   (01.11.2008 в 13:49)   письмо автору
 
   для: BinLaden   (01.11.2008 в 01:08)
 

BinLaden, Спасибо Вам огромное!

Понял ошибку! Когда сохранял страницу на локальный сервер браузер прописал:
<div id="body" class="module">
, под который и был сделал парсинг, однако в оригинале сайта:
<div id=body class=module>
- действительно так.
Исправил - Всё заработало. Ещё раз Спасибо!

  Ответить  
Rambler's Top100
вверх

Rambler's Top100 Яндекс.Метрика Яндекс цитирования