Форум: Форум PHPФорум ApacheФорум Регулярные ВыраженияФорум MySQLHTML+CSS+JavaScriptФорум FlashРазное
Новые темы: 0000000
PHP на примерах (2 издание). Авторы: Кузнецов М.В., Симдянов И.В. Объектно-ориентированное программирование на PHP. Авторы: Кузнецов М.В., Симдянов И.В. Самоучитель MySQL 5. Авторы: Кузнецов М.В., Симдянов И.В. PHP 5/6. В подлиннике. Авторы: Кузнецов М.В., Симдянов И.В. PHP 5. На примерах. Авторы: Кузнецов М.В., Симдянов И.В., Голышев С.В.
ВСЕ НАШИ КНИГИ
Консультационный центр SoftTime

Форум PHP

Выбрать другой форум

 

Здравствуйте, Посетитель!

вид форума:
Линейный форум Структурный форум

тема: substr utf-8 + кириллица
 
 автор: sl1p   (28.02.2011 в 16:04)   письмо автору
 
 

Приходит строка из внешнего файла в cp1251, например
$val = "л.вс"

далее идёт перекодировка строки в ютф8
$val = iconv('cp1251', 'utf-8', $val);

выводим на экран, всё хорошо и сладко

Далее над этой строкой проделываем:
$char = mb_substr($val, 0, 1);
и к сожалению получаем символ из космоса:\

почитал гдето в нете что после 5.2.6 какойто баг с substr и кириллицей. Так ли это? Или как куда?:)

  Ответить  
 
 автор: Лена   (28.02.2011 в 16:06)   письмо автору
 
   для: sl1p   (28.02.2011 в 16:04)
 

А если явно прописать кодировку?
$char = mb_substr($val, 0, 1,"utf-8");

  Ответить  
 
 автор: sl1p   (28.02.2011 в 16:11)   письмо автору
 
   для: Лена   (28.02.2011 в 16:06)
 

так тоже получается..

Но почему так? Строка же явно в ютф8!

  Ответить  
 
 автор: Trianon   (28.02.2011 в 18:42)   письмо автору
 
   для: sl1p   (28.02.2011 в 16:11)
 

откуда mb_substr знает, в какой кодировке строка?
Этот пакет ориентируется не на строку, а на локаль или еще какие настройки.

  Ответить  
 
 автор: sl1p   (28.02.2011 в 19:26)   письмо автору
 
   для: Trianon   (28.02.2011 в 18:42)
 

зы вернее думал всегда, даже предположительно видел гдето, что по умолчанию мб_ ориентирована на utf-8

  Ответить  
 
 автор: sl1p   (28.02.2011 в 16:08)   письмо автору
 
   для: sl1p   (28.02.2011 в 16:04)
 

попробовал даже так:
создал файл в UTF-8

$value = 'л.вс';
$char = mb_substr($value, 0, 2);


берет букву "л" только если взять 2 байта...

  Ответить  
 
 автор: sim5   (28.02.2011 в 16:34)   письмо автору
 
   для: sl1p   (28.02.2011 в 16:08)
 

php_mbstring.dll в списке подключаемых расширений какая по счету?

  Ответить  
 
 автор: sl1p   (28.02.2011 в 17:15)   письмо автору
 
   для: sim5   (28.02.2011 в 16:34)
 

;extension=php5activescript.dll
;extension=php_adt.dll
;extension=php_amf.dll
;extension=php_bcompiler.dll
;extension=php_bitset.dll
;extension=php_blenc.dll
extension=php_bz2.dll
;extension=php_bz2_filter.dll
;extension=php_classkit.dll
;extension=php_cpdf.dll
;extension=php_crack.dll
extension=php_curl.dll
;extension=php_cvsclient.dll
;extension=php_db.dll
;extension=php_dba.dll
;extension=php_dbase.dll
;extension=php_dbx.dll
;extension=php_dio.dll
;extension=php_docblock.dll
;extension=php_domxml.dll
;extension=php_doublemetaphone.dll
;extension=php_event.dll
;extension=php_exif.dll
;extension=php_fdf.dll
;extension=php_fileinfo.dll
;extension=php_filepro.dll
extension=php_gd2.dll
;extension=php_gettext.dll
;extension=php_gmp.dll
;extension=php_gopher.dll
;extension=php_haru.dll
;extension=php_htscanner.dll
;extension=php_http.dll
;extension=php_hyperwave.dll
;extension=php_ibm_db2.dll
;extension=php_id3.dll
;extension=php_ifx.dll
;extension=php_iisfunc.dll
;extension=php_imap.dll
;extension=php_ingres2.dll
;extension=php_interbase.dll
;extension=php_ldap.dll
;extension=php_lzf.dll
;extension=php_mailparse.dll
;extension=php_maxdb.dll
extension=php_mbstring.dll
........

  Ответить  
 
 автор: sim5   (28.02.2011 в 17:35)   письмо автору
 
   для: sl1p   (28.02.2011 в 17:15)
 

При работе в GD могут наблюдаться странности, если эта библиотека где-то на задворках подключается, уже поэтому ее лучше подключить первой. Не знаю для всех ли версий такое наблюдается, но есть такое.
Поключите ее первой.

  Ответить  
 
 автор: sl1p   (28.02.2011 в 18:41)   письмо автору
 
   для: sim5   (28.02.2011 в 17:35)
 

ээ... а причём здесь гд вообще?(:

  Ответить  
 
 автор: sim5   (28.02.2011 в 19:05)   письмо автору
 
   для: sl1p   (28.02.2011 в 18:41)
 

Просто проверить всякие возможные глюки, ибо если указать mb_substr кодировку, то она может исправить положение, но вы говорите, что не помогает.

  Ответить  
 
 автор: sl1p   (28.02.2011 в 19:22)   письмо автору
 
   для: sim5   (28.02.2011 в 19:05)
 

я написал что получается :) просто формулировка предложения обычно используется с "не" :))

2 Трианон,
я очень мало пользовался функцией, поэтому не знал, но спасибо за ответ :)

2 неадекват
Спасибо, то что нужно :)

  Ответить  
 
 автор: sim5   (01.03.2011 в 01:16)   письмо автору
 
   для: sl1p   (28.02.2011 в 19:22)
 

Не "не", а "тоже" меня запутала, тоесть получается "результат тот же". )
Кстати, если вы навечно закрепите кодировку преобразования, то будут ошибки с языками ипользующими и более число байт, другую кодировку. Есть же функция определяющая ее.

  Ответить  
 
 автор: neadekvat   (28.02.2011 в 18:46)   письмо автору
 
   для: sl1p   (28.02.2011 в 16:04)
 

В начале скрипта (например, в конфиг) вставьте следующую строку, чтобы не думать более о кодировках в mb_* (если уверены, конечно, что у вас все в utf-8):
mb_internal_encoding('UTF-8');

  Ответить  
Rambler's Top100
вверх

Rambler's Top100 Яндекс.Метрика Яндекс цитирования