|
|
|
| Хочу почистить "сграбленный" с чужого сайта HTML-код. В нем слишком много пробелов между тегами и пустых строк. Если готовое регулярное выражение для этого. Что-то я не нашел в темах форума. Полагаю, что это должно быть что-то типа циклической замены двойных пробелов на одинарные. | |
|
|
|
|
|
|
|
для: dmitrii_r
(01.09.2006 в 10:51)
| | Для этого обычно используют регулярное выражение вида
<?php
$text = preg_replace("|[\s]+|s", " ", $text);
?>
|
| |
|
|
|
|
|
|
|
для: cheops
(01.09.2006 в 11:13)
| | В очищаемом тексте присутствуют двойные и одинарные кавычки. Поэтому предлагаемое рег.выражение не могу использовать - не доходит до него скрипт. Присвоение $text = 'текст'; или $text = "текст"; выдает ошибку
Функция addslashes также выдает ошибку. Вообще, как закавычить (присвоить строчной переменной) произвольный HTML-текст с кавычками?
--------------
Дополнение: вышел из положения (не решив задачу с произвольным текстом с двойными и одинарными кавычками так. После preg_match_all(..., ..., $out);
Обработал вашим рег. выражением выход, получилась одна очень длинная строка. Это тоже не очень меня устраивает. Как причесать код, например, выводить по 80 символов, но не разрывать <тэги>? | |
|
|
|
|
|
|
|
|
для: Trianon
(01.09.2006 в 13:23)
| | Внимательно прочитал инструкцию по синтаксису heredoc. Попробовал, выдается ошибка в определяемой строке.
<Читайте текст из файла... file_get_contents();
Я попробовал практически этот же вариант, т.е. текст после забора с чужого сайта и "вырывания" нужных кусков, их несколько. Так и буду делать. Однако, после применения рег. выражения, что посоветовал cheops возникает длиная строка (кстати, усекается до 256 символов), что меня тоже не устраивает.
Видимо, мне подойдет вариант с очищенным "ручками" HTML-шаблоном (то, что повторяется в вырваных кусках - дизайн) и вставкой уникального, вырваного контента. Т.е. дополнительно обработаю вырванные куски.
Я думал, что задача довольно простая. Как оказалось, это не так. Спасибо, cheops и Trianon. | |
|
|
|