|
|
|
| Помогите с регулярным выражением.
Есть страница со следующей уникальной конструкцией:
<div class="TabContent">
НУЖНЫЙ ТЕКСТ ВПЕРЕМЕШКУ С ТЭГАМИ
</div>
Пытаюсь обрабатывать при помощи:
#<div\s?class="TabContent">(.*?)</div>#is
... и, к сожалению, не работает. Помогите исправить. | |
|
|
|
|
|
|
|
для: dem_rnd
(05.07.2011 в 00:37)
| | А после </div> нет никакой информации к которой бы можно было дополнительно привязаться? | |
|
|
|
|
|
|
|
для: cheops
(05.07.2011 в 11:54)
| | >А после </div> нет никакой информации к которой бы можно было дополнительно привязаться?
Есть. Вот часть страницы, из которой хочу получить нужные данные:
<div id="TabPanels" class="TabPanels">
<ul class="TabGroup">
<li class="TabbedPanelsTab TabSelected" tabindex="0" hidefocus="true" onfocus="this.blur();">Description</li>
<li class="TabbedPanelsTab" tabindex="0" hidefocus="true" onfocus="this.blur();">Payment and Shipping</li>
<li class="TabbedPanelsTab" tabindex="0" hidefocus="true" onfocus="this.blur();">Bulk Rate</li>
</ul>
<div class="TabContentGroup">
<div class="TabContent">
<div style="padding:10px;" class="goods_text">
<ul>
<li>
<span class="MsoNormal" style="MARGIN: 0cm 0cm 0pt"><span lang="EN-US">Made of carbon fiber, lightweight and portable to carry.</span></span></li>
<li>
<span class="MsoNormal" style="MARGIN: 0cm 0cm 0pt"><span lang="EN-US">4 sections.</span></span></li>
<li>
<span class="MsoNormal" style="MARGIN: 0cm 0cm 0pt"><span lang="EN-US">Hard gun shaped EVA handle.</span></span></li>
<li>
<span class="MsoNormal" style="MARGIN: 0cm 0cm 0pt"><span lang="EN-US">Telescoping design for easier storage and carry.</span></span></li>
<li>
<span class="MsoNormal" style="MARGIN: 0cm 0cm 0pt"><span lang="EN-US">Ideal for anglers.</span></span></li>
<li>
<span class="MsoNormal" style="MARGIN: 0cm 0cm 0pt"><span lang="EN-US">Extended length of rod: 6.6 inches.</span></span></li>
<li>
<span class="MsoNormal" style="MARGIN: 0cm 0cm 0pt"><span lang="EN-US">Weight bearing: 10-16LB.</span></span></li>
<li>
<span class="MsoNormal" style="MARGIN: 0cm 0cm 0pt"><span lang="EN-US">Fishing bait weight: 1/4-3/4oz.</span></span></li></ul>
</div>
<div style="padding:10px;">
<b>Product Details (including package):</b><br/>
weight:1627 g<br/>
size:54*5.5*5.5 cm<br/><br/>
<b>Pack including:</b><br/>
1 × Fishing Rod<br/>
</div>
</div>
<div class="TabContent" style="display:none">
<img src="SUN%20WOO%20XZ-66C%204%20Sections%20Telescoping%20Carbon%20Fiber%20Fishing%20Rod%20%28Blue%29_files/imglocku.gif" width="277" height="70" border="0" />
|
А </div> как-то не так обрабатывается? | |
|
|
|
|
|
|
|
для: dem_rnd
(05.07.2011 в 15:15)
| | Т.е. вот этот кусок нужен?
<div style="padding:10px;">
<b>Product Details (including package):</b><br/>
weight:1627 g<br/>
size:54*5.5*5.5 cm<br/><br/>
<b>Pack including:</b><br/>
1 × Fishing Rod<br/>
</div>
|
>А </div> как-то не так обрабатывается?
Если я правильно понимаю, у вас внутри этого тэга есть другие </div>, на которые регулярное выражение реагирует. | |
|
|
|
|
|
|
|
для: cheops
(05.07.2011 в 16:25)
| |
<div style="padding:10px;">
<b>Product Details (including package):</b><br/>
weight:1627 g<br/>
size:54*5.5*5.5 cm<br/><br/>
<b>Pack including:</b><br/>
1 × Fishing Rod<br/>
</div>
|
Этот кусок не нужен. Нужно то, что идет до него, в предыдущем DIV'е | |
|
|
|
|
|
|
|
для: dem_rnd
(05.07.2011 в 16:29)
| | Хм... тогда странно, у меня с вашим куском текста и вашим регулярным выражением все находится
<?php
$content = file_get_contents("get.txt");
$pattern = '#<div\s?class="TabContent">(.*?)</div>#is';
preg_match_all($pattern, $content, $out);
for($i = 0; $i < count($out[1]); $i++)
{
echo nl2br(htmlspecialchars($out[1][$i]));
}
?>
| У вас этот пример что выводит? | |
|
|
|
|
|
|
|
для: cheops
(05.07.2011 в 16:37)
| | Заработало, спасибо за помощь! | |
|
|
|