Форум: Форум PHPФорум ApacheФорум Регулярные ВыраженияФорум MySQLHTML+CSS+JavaScriptФорум FlashРазное
Новые темы: 0000000
PHP на примерах (2 издание). Авторы: Кузнецов М.В., Симдянов И.В. MySQL 5. В подлиннике. Авторы: Кузнецов М.В., Симдянов И.В. Самоучитель PHP 5 / 6 (3 издание). Авторы: Кузнецов М.В., Симдянов И.В. PHP 5/6. В подлиннике. Авторы: Кузнецов М.В., Симдянов И.В. Самоучитель MySQL 5. Авторы: Кузнецов М.В., Симдянов И.В.
ВСЕ НАШИ КНИГИ
Консультационный центр SoftTime

Форум PHP

Выбрать другой форум

 

Здравствуйте, Посетитель!

вид форума:
Линейный форум Структурный форум

тема: Взятие информации с чужого сайта (часть 2)
 
 автор: sata   (03.05.2005 в 18:51)   письмо автору
 
 

Вот решил новую ветку открыть так как та очень уж большая стала начало
http://softtime.ru/forum/read.php?id_forum=1&id_theme=3228

Выяснилось то что у хостинга цитирую К сожалению, в нашей конфигурфции PHP отсутствует поддержка протокола https.
Вот теперь даже незнаю что делать. Возможно ли как то по другому выдрать инфу или придётся нового хостера искать, потому что выдрать инфу именно с этого сайта первоочередная задача. Спасибо

   
 
 автор: cheops   (03.05.2005 в 19:14)   письмо автору
 
   для: sata   (03.05.2005 в 18:51)
 

Хм... вряд ли вы вообще обычными функциями с https выдерите страницу... так как нужно обмениваться ключами... люди обычно функции CURL http://www.softtime.ru/group/id_group=14 используют - они вроде этот протокол поддерживают - нужно искать провайдера у которого стоит это расширение или своего упршивать поставить.

   
 
 автор: sata   (03.05.2005 в 21:22)   письмо автору
 
   для: cheops   (03.05.2005 в 19:14)
 

Поговорил по телефону с тех поддержкой чуть удар не хватил (меня) сперва с одним админом говорил видать то ли прошаристый а мож нет всё подтвердил и сказал заяву накатать типа согласны на перенос сайта на новый сервер, но не суть в этом. Звоню значит попозже там уже другой админ отвечает видать смена пришла тот давай сначала разбираться чё за фигня, пришёл значит к выводу что на сервере всё зашибись и это скрипт глючит я ему начинаю втирать что сам он глючит и скрипт работает, он начал копаться глубже в натуре скрипт вроде глючить не должен и докопался до ошибки (кстати скрипт находится здесь можете посмотреть http://www.autolegra.ru/1.php ) что типа файла удалённого такого нет, я говорю как так был же посмотрел в натуре есть файл дальше копаться начал чё то бубнить начал про то что типа возможно какая то фигня у этих на сервере что файл не открывается возможно ли такое, а то мне с ними завтра базарить а я уже даже и незнаю чё говорить. Короче всё свелось к тому что возможно всё таки это у них https в пхп ненастроен и что счас он ничего нескажет потому что незнает что сказать.
Сорри за такой конспект чё то поговорить пробрало :)

   
 
 автор: cheops   (04.05.2005 в 21:54)   письмо автору
 
   для: sata   (03.05.2005 в 21:22)
 

Бубнящий под нос программист/админ/технарь находка для шпионов и хакеров :))) Такго узнать можно, особенно если подготовленный человек спрашивает. Я бы на месте админа попросил бы входные-выходные данные, скрипт и сказал бы "Разберёмся". Зато может вы не только себе поможете, но и всем хостящимся на их сервере :)

   
 
 автор: sata   (07.05.2005 в 12:04)   письмо автору
 
   для: cheops   (04.05.2005 в 21:54)
 

Короче полная засада и за что тока 10 баксов в месяц плочу (правда фирма платит). Нифига у них не настроен https в php так что выдрать никак неполучится, а очень надо. Помозговав немного поспрашивав у умных людей пришлося всё к выводу Что
в качастве варианта: организовать тунель. то есть какой-то скрипт на чем-то написанный, которому в качестве параметра передается адрес https сайта, а он возвращает содержимое страницы из своего скрипта обращаешься к тому, а он тебе отдает содержимое. Посоветовали мне https проще открывать из перла..
Во а вот как это реализовать что то я недогоняю, в perle я ваще не шарю.
Может будут какие нить идеи или сталкивался уже кто с этим. Спасибо

   
 
 автор: sata   (07.05.2005 в 23:49)   письмо автору
 
   для: sata   (07.05.2005 в 12:04)
 

Всё таки выдрал я инфу с их сайта через curl скрипт здесь http://www.autolegra.ru/test.php.
Уважаемый cheops я тут сижу в полной "Ж" так как незнаю что делать, а что знаю незнаю как реализовать.
Смысл всего таков: вглубь этого https://www.iaai-bid.com/ сайта попасть могут тока зареганые пользователи а их немного так как это закрытый сайт. Вот у меня и стоит задача (над которой я уже фиг знает скока думаю) нужно таблицы с машинами перенести на свой сайт при этом не выдав пароль с логином юзерам. Поразмыслив надумал тока пару вариантов.
1 вариант. Скрипт должен авторизоваться и вытащить инфу с сайта внести её в нашу базу данных а дальше уже делай что хочеш, но проблема с авторизацией и https и при этом ещё фиг знает как фотки от туда выудить к себе.
2 вариант. Возможно страницы сохранять вручную Дабы их немного и тогда вопрос с авторизацией и https отпадает напроч но остаётся вопрос как же занести инфу и фотки в базу.
Блин это последнее что нужно зделать на сайте чтобы здать его и я нифига неврубаюсь ка реализовать сиё дело вроде додумаеш идею а блин какая нить фигня заступорит всё делоБуду Благодарен за любые идеи.

   
 
 автор: cheops   (08.05.2005 в 00:31)   письмо автору
 
   для: sata   (07.05.2005 в 23:49)
 

Вы можете посмотреть ссылки по теме, а так же темы по ссылкам, а так же ссылку указанные в них - это всё вполне реально, главное получить страницу, разобрать её по винтику не вопрос, если не боитесь регулярных выражений (если боитесь, я вам помогу :).
http://www.softtime.ru/forum/read.php?id_forum=1&id_theme=3110
http://www.softtime.ru/forum/read.php?id_forum=1&id_theme=3137
http://www.softtime.ru/forum/read.php?id_forum=1&id_theme=3181

   
 
 автор: sata   (10.05.2005 в 15:07)   письмо автору
 
   для: cheops   (08.05.2005 в 00:31)
 

Мда что то с регулярками у меня совсем туго, Но я их небоюсь :)
Приложил файл страницы откуда выдирается
Захороводил я что то типа этого

<?php 
set_time_limit
(0); 
$page file_get_contents("http://autolegra.ru/details.htm"); 
$pattern "|<SPAN id=stockNumber2>([^])</SPAN>|"
preg_match_all ($pattern,$page,$out,PREG_PATTERN_ORDER); 
echo 
"<pre>"
  
print_r($out[1]); 
  echo 
"</pre>";
?> 

Но результата недобился. Страница с тех характеристиками машины каждая характеристика имеет свою метку вот сижу копаю как их оттуда изьять. После изьятия уже в базу закинуть как нефиг делать.

   
 
 автор: sata   (10.05.2005 в 17:09)   письмо автору
 
   для: sata   (10.05.2005 в 15:07)
 

О блин допёрло :)

<?php 
set_time_limit
(0); 
$page file_get_contents("http://autolegra.ru/details.htm"); 
$pattern "|<SPAN id=stockNumber2>([0-9]+)</SPAN>|"
preg_match_all ($pattern,$page,$out,PREG_PATTERN_ORDER); 
echo 
"<table>"
for(
$i 0$i count($out[1]); $i++) 

echo 
"<tr><td>".$out[1][$i]."</td></tr>"

echo 
"</table>";
?> 

   
 
 автор: sata   (10.05.2005 в 20:44)   письмо автору
 
   для: sata   (10.05.2005 в 17:09)
 

Вот сварганил скриптик (неработает) что то я опять с регами намухливал. Непоможите

<?
set_time_limit
(0); 
//Открываем страницу
$url "https://www.iaai-bid.com/branchauctions.aspx?branch=623";
$ch curl_init();
curl_setopt($chCURLOPT_SSL_VERIFYPEERFALSE);
curl_setopt($chCURLOPT_URL,$url);
curl_setopt($chCURLOPT_FAILONERROR1);
curl_setopt($chCURLOPT_FOLLOWLOCATION1);
curl_setopt($chCURLOPT_RETURNTRANSFER,1);
curl_setopt($chCURLOPT_TIMEOUT3);
$result curl_exec($ch);//сохраняем содержание в переменную
//===================
$page file_get_contents("$result"); 
$pattern "|<A class=stockno href=([-a-z0-9])</A>|"
preg_match_all ($pattern,$page,$out,PREG_PATTERN_ORDER);
print_r($out[1]);  
curl_close($ch); 
?>

   
 
 автор: cheops   (11.05.2005 в 12:15)   письмо автору
 
   для: sata   (10.05.2005 в 20:44)
 

А какой кусок необходимо извлечь?

   
 
 автор: sata   (11.05.2005 в 22:32)   письмо автору
 
   для: cheops   (11.05.2005 в 12:15)
 

А взять нужно все характеристики они все имеют метки я для теста взял тока Stock Number он с меткой class=stockno. Зделал отсев тока по номеру а вот всё в куче нифига неполучается что то. Сварганил уже бета версию скрипта который по идее должон работать но загвоздочка вот собственно в чём по идее открываем страницу и содержимое должно сохраняться в файл потом файл фильтруется регами и выводится результат, в файл ничего не сохраняется но если тестить просто на вывод то страница выдирается и выводится на экран. Чё то я как то запутано обьяснил.
Тут в будущем есть одна проблема текст то сохранится в базу, а вот как быть с фотками при выводе все урлы меняются.
И вопрос по идее если как то выдрать эти фотки их же можно сохранить в базу как бинарники (в BLOB ) или их аплоэдить придётся. Спасибо

   
Rambler's Top100
вверх

Rambler's Top100 Яндекс.Метрика Яндекс цитирования