|
|
|
| Необходимо написать парсер.
С помощью рег. выпажения
получить содержимое не получается. Как правильно составить рег. выражение?
И еще хотел поинтересовать есть ли программы для работы с РВ? | |
|
|
|
|
|
|
|
для: Adj
(13.03.2010 в 15:10)
| | Получить содержимое между тегами <body> можно так:
$text = "<body>текст</body>";
preg_match("/(<body>)(.*)(<\/body>)/", $text, $sovpad);
echo $sovpad[0]; | |
|
|
|
|
|
|
|
для: Adj
(13.03.2010 в 15:10)
| | По программам:
Под FireFox есть плагин:
https://addons.mozilla.org/ru/firefox/addon/2077
А также есть пара неплохих онлайн-конструкторов:
http://www.regexpal.com/
http://myregexp.com/
http://www.pcre.ru/eval/ | |
|
|
|
|
|
|
|
для: Adj
(13.03.2010 в 15:10)
| | Можно еще такой паттерн использовать:
Тогда мы игнорируем пробелы в начале и конце строки, регистр, и используем в качестве ограничения результат из первого кармана - (</\1). | |
|
|
|
|
|
|
|
для: Adj
(13.03.2010 в 15:10)
| |
(<body>)(.*)(<\/body>)
<(body>)(.*?)(</\1)
|
Ничем не отличаются от мною приведенного шаблона, кроме жадности.
Такой шаблон <body>(.*)<\/body> не срабатывает если между тегами есть \r\n, в Unix не пробовал.
<body>
\r\n<h1>Заголовок</h1>
\r\n
\r\n<p>Текст</p>
\r\n</body>
|
в данном варианте содержимое не находиться, но когда удаляешь \r\n, все срабатывате
<body><h1>Заголовок</h1><p>Текст</p></body>
|
Вот такой паттерн тоже не работает: <body>(\s|.)*<\/body> | |
|
|
|
|
|
|
|
для: Adj
(14.03.2010 в 10:28)
| | "/<body>(.*)<\/body>/uis" | |
|
|
|
|
|
|
|
для: Красная_шляпа
(18.03.2010 в 23:36)
| | u убери если не utf-8 | |
|
|
|
|
|
|
|
для: Красная_шляпа
(18.03.2010 в 23:36)
| | Спасибо! Работает! | |
|
|
|
|
|
|
|
для: Adj
(19.03.2010 в 22:36)
| | | |
|
|
|
|
|
|
|
для: skinny
(20.03.2010 в 19:11)
| | (.*?) первое незачем брать в скобки если не нужно то что туда попадёт
(.*?) второе будет работать медленнее чем (.*), но если <\/body> две штуки выберет только до первого <\/body>
иногда лучше два раза отрезать с краёв , чем выдирать середину. Не занимает лишней памяти. | |
|
|
|
|
|
|
|
для: skinny
(20.03.2010 в 19:11)
| | Я думаю вот так будет лучше
| |
|
|
|
|
|
|
|
для: Adj
(21.03.2010 в 11:12)
| | Вот замечательная функция php tidy_get_body | |
|
|
|
|
|
|
|
для: Usta
(25.03.2010 в 12:40)
| | Спасибо, не знал! | |
|
|
|