Форум: Форум PHPФорум ApacheФорум Регулярные ВыраженияФорум MySQLHTML+CSS+JavaScriptФорум FlashРазное
Новые темы: 0000000
PHP. Практика создания Web-сайтов (второе издание). Авторы: Кузнецов М.В., Симдянов И.В. Самоучитель PHP 5 / 6 (3 издание). Авторы: Кузнецов М.В., Симдянов И.В. Объектно-ориентированное программирование на PHP. Авторы: Кузнецов М.В., Симдянов И.В. MySQL на примерах. Авторы: Кузнецов М.В., Симдянов И.В. Программирование. Ступени успешной карьеры. Авторы: Кузнецов М.В., Симдянов И.В.
ВСЕ НАШИ КНИГИ
Консультационный центр SoftTime

Форум Регулярные Выражения

Выбрать другой форум

 

Здравствуйте, Посетитель!

вид форума:
Линейный форум Структурный форум

тема: Запись фрагментов HTML страницы в базы
 
 автор: Agronom   (09.09.2005 в 17:51)   письмо автору
 
 

Здравствуйте, господа.

Я тут задумал сделать поиск на сайте.
Вот только не знаю как заносить информацию в базу данных.
Идея такая:
Пользователь (кроме админа) будет заходить на сайт и переходить по страницам, при обращении к странице в базу должны добавляться
- заголовок
- содержмое META тегов
- адрес страницы
- содержимое

Заголовок и адрес можно извечь из глобального массива, а вот как извлекать остальное, тут прошу вашей помощи.

Эти самые страницы сначала формируются пхп. А потом из них надо извлечь это все и записать в базы...
Самое главное - содержимое, его нужно извлекать из <body> ... </body> пропуская теги... после чего записывать в базу.

Заранее благодарю :)

   
 
 автор: napTu3aH   (09.09.2005 в 18:17)   письмо автору
 
   для: Agronom   (09.09.2005 в 17:51)
 

я не силен в рег. выражениях, попробуйте это

  $text="<body>asjkghkjdakldlHDSLKJHASDA</body>"
  preg_match_all("#<body>([^/]+)</body>#",$text,$body);

   
 
 автор: cheops   (09.09.2005 в 19:30)   письмо автору
 
   для: Agronom   (09.09.2005 в 17:51)
 

<body> - это уникальные тэги, поэтому можно их найти и вырезать текст, после чего удалить все тэги - для этого в PHP имеется специальная функция strip_tags()
<?php 
  $text 
file_get_contents('opr000JR.htm'); // Здесь может быть URL
  
$pos_begin strpos($text,'<body');
  
$pos_end   strpos($text,'</body>');
  
$body substr($text$pos_begin$pos_end $pos_begin);
  
$body strip_tags($body);
  echo 
$body;
?>

После этого правда тьма тьмущая пробелов остаётся вместо тэгов, но это уже технический вопрос.

   
Rambler's Top100
вверх

Rambler's Top100 Яндекс.Метрика Яндекс цитирования