|
|
|
| Очень был нужна информация из раздела форума. Упросил админа выслать дамп.
Дамп он мне выстал в Екселевском формате, и на все мои просьбы выслать в виде csv ничем не окончались. У них какаято система которая сразу переводит в xls...
Это пол беды, пересохраню я его из xls в csv. Только вот вместо текста у меня вот такие иероглифы, никак не могу понять что это за кодировка. Может кто-то сталкивался и сможет подсказать
Это вместо русских символов...
Îôèöèàëüíîå çàÿâëåíè
Àäðåñ íîâîãî ôîðóìà Àëüÿíñà
|
| |
|
|
|
|
|
|
|
для: Ученик
(21.11.2006 в 13:43)
| | windows-1251 в обертке html encoding
Официальное заявлени Адрес нового форума Альянса | |
|
|
|
|
|
|
|
для: Trianon
(21.11.2006 в 13:52)
| | Если честно так и непонял как у вас получился русский текст :(
Но тут у меня возникла еще бОльшая проблема. Когда пересохряняю файл как csv вместо иероглифов просто вопросительные знаки. А тот текст который я выложил в форум это пересохраненный хтмл из Екселя...
У меня получается хтмл файл размеров в 5 метров....
Наверно прийдется мучать админа дальше...
З.Ы.
Trianon если вы мне на пальцах покажите как вы получили русский текст я нашел один ооочень запутанный вариант, но в теории должен сработать :) | |
|
|
|
|
|
|
|
для: Ученик
(21.11.2006 в 14:28)
| | Вариант 1. Вывести этот текст в браузере и руками принудительно поставить кодировку cp-1251.
Вариант 2. прогнать текст через скрипт, который снимет html-обертку и сохранить как текст
в кодировке ANSI (что для русской windows есть именно cp-1251).
$text=preg_replace('/&#([\d]+);/e','(intval (\1) >=128 && intval (\1) <= 255 ? chr(\1) : "&#\1;")',$text);
|
| |
|
|
|
|
|
|
|
для: Trianon
(21.11.2006 в 14:50)
| | Спасибо разобрался. Я только сейчас заметил что текст который был у меня в дампе прошел через htmlspecialchars форума....
На самом деле он выглядил вот так :)
Ïðîåêò
'FD'. Ïîëíàÿ
âåðñèÿ
|
| |
|
|
|