|
|
|
| В таблице http://www.tamasoft.co.jp/en/general-info/unicode.html коды представлены в компактном, но не совсем понятном виде.
К примеру, русская буква "а" находится на пересечении строки 0420 и столбца 10.
И что это означает? Что её код 0430 (\x04\x30) ?
Однако известно, что код буквы "а" - \xD0\xB0 ! | |
|
|
|
|
|
|
|
для: Владимир55
(12.07.2012 в 09:29)
| | А это часом не UTF-16? | |
|
|
|
|
|
|
|
для: Владимир55
(12.07.2012 в 09:29)
| | Так и понимать, так как d0bo, это в UTF-8, а не в unicode. | |
|
|
|
|
|
|
|
для: confirm
(12.07.2012 в 18:07)
| | Почему то мне казалось, что это одно и тоже. Точнее, что одно является частным случаем другого. Оказывается, что и Ворд использует unicode, а не UTF-8.
Вот здесь все сошлось: http://www.utf8-chartable.de/ | |
|
|
|
|
|
|
|
для: Владимир55
(12.07.2012 в 19:11)
| | Unicode - это UTF-16, да Windows и многие программы используют именно её, эту кодировку нельзя использовать в сети, так как ряд символов UTF-16 совпадают с управляющими символами (да и мало в UTF-16 помещается, UTF-8 больше символов может закодировать). | |
|
|
|