Удалить повторяющиеся теги

Форум:	Форум PHP	Форум Apache	Форум Регулярные Выражения	Форум MySQL	HTML+CSS+JavaScript	Форум Flash	Разное
Новые темы:	0	0	0	0	0	0	0

Здравствуйте, Посетитель!

вид форума:

тема: Удалить повторяющиеся теги

следующая тема

предыдущая тема

автор: Night_Wolf (26.12.2008 в 17:24) письмо автору

Здравствуйте, помогите пожалуйста с выражением для замены повторяющихся тегов на один. Главный нюанс - межде тегами может оказаться символ переноса строки (\n или \r\n).

Вот пример текста:

Текст текст текст Текст текст текст Текст текст Текст текст текст Текст текст текст

Пробовал так:

//и так: $String=preg_replace('/(<br[^>]*?>){1,}/i','\1',$String); //и так: $String=preg_replace("/(<br[^>]*?>){1,}.\n/i",'\1\1',$String);

Ничего хорошего не выходит. Надеюсь на вашу помощь...

Ответить

автор: xx77 (26.12.2008 в 17:37) письмо автору

для: Night_Wolf (26.12.2008 в 17:24)

*? совсем необязательно, т.к [^>]* и так не включит не одного >
наверное лучше как-то сразу заменять вместе с пробельными символами \s на последнее совпадение
<? $String=preg_replace('/(<br[^>]*>\s*)+/i','\1',$String);

или вообще ничего не захватывать
<? $String=preg_replace('/(?:<br[^>]*>\s*)+/i'," \n",$String);
, но из-за этого может получиться что половина переносов строк будут \r\n а половина \n

Ответить

автор: Night_Wolf (26.12.2008 в 17:48) письмо автору

для: xx77 (26.12.2008 в 17:37)

Спасибо огромное! И 1-й и 2-й варианты решили проблему. Совсем забыл, что \s -любой пробельный символ, в т.ч. и newline (думал это только пробел " ").

Позвольте задать еще один сопутствующий вопрос?

І. Текст текст 

Возможно ли удалить вложенные теги ? Хотя текст уже приобрел довольно нормальный вид, но из-за них кое-где все-же пооставались двойные ? Просто идей никаких нет, вообще кажется это нереальным при помощи одних лишь регулярных выражений. Но все-же?

Возможно поступлю таким образом:
1. preg_match_all('/*/',$String,$matches) -найти все *
2. strip_tags($matches,' '), исключая 
3. Ну и на последок удалить все двойные 

Еще раз спасибо!

Ответить

автор: xx77 (26.12.2008 в 19:43) письмо автору

для: Night_Wolf (26.12.2008 в 17:48)

С одной стороны можно удалить все которые выделяют текст который и так уже должен бытьжирным шрифтом
, но это не всегда повлияет на то будут ли два меж которыми не будет </?b>

если-бы знать что точно это b , и что это только в одном промежутке стоящие среди br теги b,
то можно было-бы так
<pre><? $text = ' Текст текст текст Текст текст текст '; // запишет как echo htmlspecialchars( preg_replace( '~(?:((?:</?b\b[^>]*>\s*)+)?<br[^>]*>(\s+)?)+~i' ,'\1 \2' ,$text)); ?>

если не разбирая лишние-ли </?b> придётся делать что-то такое
<pre><? $p = array( '~(?:<br[^>]*>\s*)+((?:</?b\b[^>]*>\s*)+)~i', '~(?:<br[^>]*>\s*)+~i' ); $z = array( "\\1 \n", " \n" ); echo htmlspecialchars( $text = preg_replace($p, $z ,$text)); ?>

Но это не обязательно самое оптимальное
, возможно что-то более шустрое получилось-бы если preg_replace_callback() скормить пачками все эти .
и насчёт разбора вложенности тоже или preg_replace_callback() или ~e модификатор

Ответить

автор: Night_Wolf (27.12.2008 в 14:56) письмо автору

для: xx77 (26.12.2008 в 19:43)

Спасибо. Чесно говоря, помог лишь 2-й вариант. Первый удалил махом закрывающий тег в середине текста, выделив весь нижеидущий текст жирным.

Все-же пробую разбирать текст по-строчно, отдельно обрабатывая каждую строку. Дело в том, что каждый тег в тексте - 100% имеет закрывающий . Но это пожалуй единственнон от чего можно плясать.

Вот тут регулярное выражение будет иметь больше шансов, как мне кажется:

Array( ' ', 'text '; ' '; ' ', ' ' )

И далее array_map().
Попробую модифицировать Ваш паттерн для удаления дублей и пустых тегов.

Спасибо.

Ответить

вверх

Форум Регулярные Выражения