Форум: Форум PHPФорум ApacheФорум Регулярные ВыраженияФорум MySQLHTML+CSS+JavaScriptФорум FlashРазное
Новые темы: 0000000
PHP 5/6. В подлиннике. Авторы: Кузнецов М.В., Симдянов И.В. C++. Мастер-класс в задачах и примерах. Авторы: Кузнецов М.В., Симдянов И.В. PHP на примерах (2 издание). Авторы: Кузнецов М.В., Симдянов И.В. Программирование. Ступени успешной карьеры. Авторы: Кузнецов М.В., Симдянов И.В. MySQL 5. В подлиннике. Авторы: Кузнецов М.В., Симдянов И.В.
ВСЕ НАШИ КНИГИ
Консультационный центр SoftTime

Форум Регулярные Выражения

Выбрать другой форум

 

Здравствуйте, Посетитель!

вид форума:
Линейный форум Структурный форум

тема: Как убрать лишние пробелы и переводы строк
 
 автор: dmitrii_r   (01.09.2006 в 10:51)   письмо автору
 
 

Хочу почистить "сграбленный" с чужого сайта HTML-код. В нем слишком много пробелов между тегами и пустых строк. Если готовое регулярное выражение для этого. Что-то я не нашел в темах форума. Полагаю, что это должно быть что-то типа циклической замены двойных пробелов на одинарные.

   
 
 автор: cheops   (01.09.2006 в 11:13)   письмо автору
 
   для: dmitrii_r   (01.09.2006 в 10:51)
 

Для этого обычно используют регулярное выражение вида
<?php
  $text 
preg_replace("|[\s]+|s"" "$text);
?>

   
 
 автор: dmitrii_r   (01.09.2006 в 11:39)   письмо автору
 
   для: cheops   (01.09.2006 в 11:13)
 

В очищаемом тексте присутствуют двойные и одинарные кавычки. Поэтому предлагаемое рег.выражение не могу использовать - не доходит до него скрипт. Присвоение $text = 'текст'; или $text = "текст"; выдает ошибку

Функция addslashes также выдает ошибку. Вообще, как закавычить (присвоить строчной переменной) произвольный HTML-текст с кавычками?

--------------
Дополнение: вышел из положения (не решив задачу с произвольным текстом с двойными и одинарными кавычками так. После preg_match_all(..., ..., $out);
Обработал вашим рег. выражением выход, получилась одна очень длинная строка. Это тоже не очень меня устраивает. Как причесать код, например, выводить по 80 символов, но не разрывать <тэги>?

   
 
 автор: Trianon   (01.09.2006 в 13:23)   письмо автору
 
   для: dmitrii_r   (01.09.2006 в 11:39)
 

Читайте текст из файла... file_get_contents();
или используйте синтаксис heredoc
http://www.php.net/manual/ru/language.types.string.php#language.types.string.syntax.heredoc

   
 
 автор: dmitrii_r   (01.09.2006 в 16:30)   письмо автору
 
   для: Trianon   (01.09.2006 в 13:23)
 

Внимательно прочитал инструкцию по синтаксису heredoc. Попробовал, выдается ошибка в определяемой строке.

<Читайте текст из файла... file_get_contents();

Я попробовал практически этот же вариант, т.е. текст после забора с чужого сайта и "вырывания" нужных кусков, их несколько. Так и буду делать. Однако, после применения рег. выражения, что посоветовал cheops возникает длиная строка (кстати, усекается до 256 символов), что меня тоже не устраивает.

Видимо, мне подойдет вариант с очищенным "ручками" HTML-шаблоном (то, что повторяется в вырваных кусках - дизайн) и вставкой уникального, вырваного контента. Т.е. дополнительно обработаю вырванные куски.

Я думал, что задача довольно простая. Как оказалось, это не так. Спасибо, cheops и Trianon.

   
Rambler's Top100
вверх

Rambler's Top100 Яндекс.Метрика Яндекс цитирования