|
|
|
| Здравствуйте. Есть такая задача, у меня имеется функция которая загружает страницу и записывает её в переменную. Мне нужно в результате её работы получить массив вида:
Array {
[html]=>Array {
[head]=>Array {
[title]=>Title страницы
[meta]=>Array {
name=>Имя
value=>Значение
}
}
}
}
|
и так далее. При этом нужно чтоб он обрезал DOCTYPE который мешает, т.е чтоб его небыло в массиве и что бы умел работать с самозакрывающимися тегами.
Подскажите как так сделать? Или дайте уже готовый парсер, я в регулярных выражениях не силён. | |
|
|
|
|
|
|
|
для: pavluxa09
(02.08.2010 в 14:35)
| | >Или дайте уже готовый парсер, я в регулярных выражениях не силён.
Ага, давайте парсить хтмл регулярками на пыхе.
Пользуйтесь DOMDocument или SimpleXML, или что-то в этом роде... Массив с этого правда не получится, но структура будет... | |
|
|
|