Форум: Форум PHPФорум ApacheФорум Регулярные ВыраженияФорум MySQLHTML+CSS+JavaScriptФорум FlashРазное
Новые темы: 0000000
Объектно-ориентированное программирование на PHP. Авторы: Кузнецов М.В., Симдянов И.В. Социальная инженерия и социальные хакеры. Авторы: Кузнецов М.В., Симдянов И.В. C++. Мастер-класс в задачах и примерах. Авторы: Кузнецов М.В., Симдянов И.В. PHP на примерах (2 издание). Авторы: Кузнецов М.В., Симдянов И.В. Самоучитель MySQL 5. Авторы: Кузнецов М.В., Симдянов И.В.
ВСЕ НАШИ КНИГИ
Консультационный центр SoftTime

Форум Регулярные Выражения

Выбрать другой форум

 

Здравствуйте, Посетитель!

вид форума:
Линейный форум Структурный форум

тема: UTF-8 и preg
 
 автор: Loki   (10.05.2007 в 15:36)   письмо автору
 
 

Есть следующий код в utf
<? 
echo setlocale(LC_CTYPE,'ru_RU')."<br />";
$word="это софтовый текст";
echo 
preg_replace('/\b(софт\w*)\b/''!!!!$1!!!!'$word);
?>

по логике, он должен отметить в тексте слово начинающееся на "софт". И с некоторыми словами все прохродит гладко. А в некоторых границы слова определяются неправильно и символ рубится пополам, как в случае выше.
библиотека mbsrting имеет только функции mb_ereg...
можно ли preg заставить адекватно воспринимать utf8?

   
 
 автор: Unkind   (10.05.2007 в 15:40)   письмо автору
 
   для: Loki   (10.05.2007 в 15:36)
 

Добавьте модификатор "u".

   
 
 автор: Loki   (10.05.2007 в 16:15)   письмо автору
 
   для: Unkind   (10.05.2007 в 15:40)
 

это лишь покажет что кодировка многобайтовая. \b все равно не будет обрабатываться правильно.

   
Rambler's Top100
вверх

Rambler's Top100 Яндекс.Метрика Яндекс цитирования