|
|
|
|
|
для: alexan
(04.06.2010 в 06:54)
| | 1. Ссылки можно сохранить при помощи такой схемы
<?php
$text = "Предложение г. .html предложение. Предложение";
$pattern = "~[\.?!]+(?!htm)~";
$arr = preg_split($pattern, $text, $matches);
echo "<pre>";
print_r($arr);
echo "</pre>";
?>
|
Она же, кстати, позволяет наращивать знаки припинания. | |
|
|
|
|
|
|
| Здравствуйте друзья!
Столкнулся с задачей разбить текст на предложения. Пошел стандартным путем, регулярка вида:
$pattern = "~[^\.?!]+~";
preg_match_all($pattern, $text, $matches);
все бы ничего, но
1. В тексте попадаются ссылки и регулярка естественно их тоже разрезает
2. Попадаются сокращения
Можно ли написать выражение, которое разобьет текст на предложения, но будет обходить ссылки(.html, .htm и т.д.) и сокращения(3-4буквы+".")?
И можно ли сделать так, чтоб выражение вообще не трогало знаки препинания(.!?), а просто добавляло к ним знак "¦", чтобы по нему потом и разбивать?
Заранее благодарен, очень жду ваших советов, ну очч. надо! | |
|
|
|
|