|
|
|
| Мой сайт в УТФ-8, а граблю с сайта в виндовс-1251, в итоге ничего не грабится - скрипт не находит фраз, по которым режется содержимое. Что делать?
Спасибо. | |
|
|
|
|
|
|
|
для: coloboc66
(08.05.2012 в 17:29)
| | Лучше всего при помощи iconv() преобразовать Windows-1251 в UTF-8. Если используете регулярные выражения не забывайте модификатор u. | |
|
|
|
|
|
|
|
для: cheops
(08.05.2012 в 17:37)
| | А как скриптом определить кодировку файла? Я хочу вставлять её в виде строковой переменной для работы iconv() примерно так:
$url="http://someurl.com";
$file=file_get_contents($url);
$enc= // здесь нужно как-то определить кодировку файла
if($enc!="UTF-8")$file=iconv($enc,"UTF-8",$file);
|
| |
|
|
|
|
|
|
|
|
для: coloboc66
(10.05.2012 в 12:18)
| |
$charset = mb_detect_encoding($string);
| Узнать кодировку контента запрашиваемого url можно - get_headers() или get_meta_tags(). | |
|
|
|
|
|
|
|
для: confirm
(10.05.2012 в 13:25)
| | $string - это url? | |
|
|
|
|
|
|
|
для: coloboc66
(10.05.2012 в 13:28)
| | Это строка, кодировку которой надо узнать. О url ниже сказано. | |
|
|
|