Форум: Форум PHPФорум ApacheФорум Регулярные ВыраженияФорум MySQLHTML+CSS+JavaScriptФорум FlashРазное
Новые темы: 0000000
MySQL 5. В подлиннике. Авторы: Кузнецов М.В., Симдянов И.В. C++. Мастер-класс в задачах и примерах. Авторы: Кузнецов М.В., Симдянов И.В. MySQL на примерах. Авторы: Кузнецов М.В., Симдянов И.В. Социальная инженерия и социальные хакеры. Авторы: Кузнецов М.В., Симдянов И.В. Самоучитель PHP 5 / 6 (3 издание). Авторы: Кузнецов М.В., Симдянов И.В.
ВСЕ НАШИ КНИГИ
Консультационный центр SoftTime

Форум PHP

Выбрать другой форум

 

Здравствуйте, Посетитель!

вид форума:
Линейный форум Структурный форум

тема: Проблема с кодировкой при парсинге!
 
 автор: yasnikov   (20.09.2011 в 15:40)   письмо автору
92.7 Кб
 
 

Привет всем.

Народ помогите разобраться с кодировкой при добавлении (парсером) в базу данных.
Перепробовал много вариантов.
В базе данных есть одна таблица в кодировке cp1251_general_ci, в ней одно поле text так же в кодировке cp1251_general_ci . Сайт донор в кодировке windows-1251.
При парсинге хоть - что ты делай все равно получаются иероглифы в базе данных

Спасибо всем кто поможет!

Внизу сам парсер!

$content = file_get_contents($URL); // содержимое кода

$tag_in = substr("<h2 class=\"h1\">",-5);
$tag_off = "<div class=\"ar\">";
//$srezka = strpos ($content,$taf_in); // где ищем что ищем начало
//$content = substr($content,$srezka);
//$srezka = strpos ($content,$tag_off); // где заканчиваем поиск.
//$content = substr($content,5,$srezka); // конец

preg_match_all("/title>[^>]+>/",$content ,$title);  
preg_match_all("/link>[^>]+>/",$content ,$link);  
preg_match_all("/description>[^>]+>/",$content ,$description);  

/*PREG_MATCH_ALL имеет три параметра что ищем, где ищем, во что заносим*/  

$count = count($title[0])-1;  // count подсчитывает сколько всего тайтлов 
$count = 4; // устагнавливаем число сколько брать
for($i=2;$i<$count;$i++){
echo "<h4>" . trim(substr($title[0][$i],6,-8)) . "</h4>";
echo trim(substr($link[0][$i],5,-7));
echo "<h6>" . trim(substr($description[0][$i],12)) . "</h6>";   
echo "<hr/> ";

$link_films = trim(substr($link[0][$i],5,-7)); // заносим ссылку из рсс в переменную
$spizdet_content= file_get_contents($link_films); // переходим по ссылке



$srezka = strpos ($spizdet_content,$tag_in); // где изем что ищем
$spizdet_content = substr($spizdet_content,$srezka);
$srezka = strpos ($spizdet_content,$tag_off);
$spizdet_content = substr($spizdet_content,5,$srezka);

//echo $spizdet_content;



//$spizdet_content =iconv("windows-1251","windows-1251", $spizdet_content);
//$spizdet_content =iconv("windows-1251","windows-1251", $spizdet_content);


//print_r ($spizdet_content);

$query= ("INSERT INTO `parser` (`text`) VALUES ('$spizdet_content')");
$result= mysql_query ($query) or die(mysql_error());


if ($result == 'true') {
    
    echo "ВСЕ ЗАПИСАЛ!";
    
}

else {
    
    echo "НЕ ПОЛУЧИЛОСЬ ЗАПИСАТЬ!"; exit(mysql_error()); }
    



внизу скрин базы данных ....

http://s1.ipicture.ru/uploads/20110920/RVngMm38.jpg

  Ответить  
 
 автор: Slo_Nik   (20.09.2011 в 16:13)   письмо автору
 
   для: yasnikov   (20.09.2011 в 15:40)
 

укажите кодировку соединения с базой в файле подключения к БД.
перед записью в БД выведите данные в браузер, проверьте, нормально отображаются или нет?

  Ответить  
 
 автор: yasnikov   (20.09.2011 в 16:19)   письмо автору
 
   для: Slo_Nik   (20.09.2011 в 16:13)
 

Пробовал не помогло!

  Ответить  
 
 автор: Slo_Nik   (20.09.2011 в 19:20)   письмо автору
 
   для: yasnikov   (20.09.2011 в 16:19)
 

в браузер вывод делали, нормально читается?

  Ответить  
 
 автор: yasnikov   (21.09.2011 в 11:43)   письмо автору
 
   для: Slo_Nik   (20.09.2011 в 19:20)
 

ДА ! в браузере все нормально !

  Ответить  
Rambler's Top100
вверх

Rambler's Top100 Яндекс.Метрика Яндекс цитирования