| Как PHP мог бы понять, что Вам хочется именно эти теги считать уже контентом, а внешние - узлами дерева DOM? Он преобразует их так же, как table, tr, td.
Получить innerHTML можно, в общем случае,
- создав новый пустой объект DOMDocument,
- импортировав в него нужный узел с помощью метода importNode,
- преобразовав результат в строку с помощью метода saveHTML,
- удалив строковыми функциями лишние внешние теги.
(Как Вы понимаете, это шаги одного способа, а не четыре альтернативы).
Вообще же, возможно, в Вашем случае проще обойтись регулярками, или explode в цикле, или strpos / substr в цикле. Зависит от того, что еще есть в test.htm вообще и в ячейках в частности.
Если то, что вы привели, вполне иллюстрирует содержимое html-файла, то, вероятно, быстрее всего будет что-то вроде
<?php
$html = file_get_contents('test.htm');
while(strstr($html, '<td>'))
{
list($tmp, $html) = explode('<td>', $html, 2);
list($needle, $html) = explode('</td>', $html, 2);
echo $needle; //В переменной $needle - содержимое очередной ячейки. Делаем с ним что-то.
}
?>
|
| |