|
|
|
| Есть примерно такой код:
<it>
<тег1>описание, есть русские, английские символы, а так же цыфры</тег1>
<тег2>описание 2, есть русские, английские символы, а так же цыфры</тег2>
<тег3>описание 3, есть русские, английские символы, а так же цыфры</тег3>
</it>
Нужно выдрать все что между тегами <it>
Вот как делаю, но не получается:
preg_match_all("|<it>([[:alnum:]]+)</it>|i",$buf,$it,PREG_PATTERN_ORDER);
Думаю скорее всего в [[:alnum:]] не входят спецсимволы (к примеру точка). Как написать регулярное выражения для любого количества любых символов цифр и спецсимволов? | |
|
|
|
|
|
|
|
для: Volodja
(02.09.2005 в 11:54)
| | А много тэгов <it> на странице? И есть ли какой-нибудь уникальный символ, который не присутствует в тексте, например | или ^? Дело в том, что такие тексты разбирают путём замены тэгов <it> на такой уникальный символ, а потом играют на вхождении или невхождении его в класс [^\|]+ | |
|
|
|
|
|
|
|
для: Volodja
(02.09.2005 в 11:54)
| | Попробуйте данный скрипт.
Как видно, последние 3 строчки он в расчет не берет, так как нет закрывающего </it>
<?php
$text = <<<TEXT
<it>
<тег1>описание, есть русские, английские символы, а так же цыфры</тег1>
<тег2>описание 2, есть русские, английские символы, а так же цыфры</тег2>
<тег3>описание 3, есть русские, английские символы, а так же цыфры</тег3>
</it>
<it>
<тег1a>описание, есть русские, английские символы, а так же цыфры</тег1>
<тег2a>описание 2, есть русские, английские символы, а так же цыфры</тег2>
<тег3a>описание 3, есть русские, английские символы, а так же цыфры</тег3>
</it>
<it>
<тег1b>описание, есть русские, английские символы, а так же цыфры</тег1>
<тег2b>описание 2, есть русские, английские символы, а так же цыфры</тег2>
<тег3b>описание 3, есть русские, английские символы, а так же цыфры</тег3>
TEXT;
$pattern = "!(?<=<it>).+?(?=</it>)!s";
if( preg_match_all($pattern, $text, $matches) )
print_r($matches);
else
print "error";
?>
|
| |
|
|
|