Взятие информации с чужого сайта (часть 2)

Форум:	Форум PHP	Форум Apache	Форум Регулярные Выражения	Форум MySQL	HTML+CSS+JavaScript	Форум Flash	Разное
Новые темы:	0	0	0	0	0	0	0

Здравствуйте, Посетитель!

вид форума:

тема: Взятие информации с чужого сайта (часть 2)

следующая тема

предыдущая тема

	автор: sata (03.05.2005 в 18:51) письмо автору
	Вот решил новую ветку открыть так как та очень уж большая стала начало http://softtime.ru/forum/read.php?id_forum=1&id_theme=3228 Выяснилось то что у хостинга цитирую К сожалению, в нашей конфигурфции PHP отсутствует поддержка протокола https. Вот теперь даже незнаю что делать. Возможно ли как то по другому выдрать инфу или придётся нового хостера искать, потому что выдрать инфу именно с этого сайта первоочередная задача. Спасибо

	автор: cheops (03.05.2005 в 19:14) письмо автору
	для: sata (03.05.2005 в 18:51)
	Хм... вряд ли вы вообще обычными функциями с https выдерите страницу... так как нужно обмениваться ключами... люди обычно функции CURL http://www.softtime.ru/group/id_group=14 используют - они вроде этот протокол поддерживают - нужно искать провайдера у которого стоит это расширение или своего упршивать поставить.

	автор: sata (03.05.2005 в 21:22) письмо автору
	для: cheops (03.05.2005 в 19:14)
	Поговорил по телефону с тех поддержкой чуть удар не хватил (меня) сперва с одним админом говорил видать то ли прошаристый а мож нет всё подтвердил и сказал заяву накатать типа согласны на перенос сайта на новый сервер, но не суть в этом. Звоню значит попозже там уже другой админ отвечает видать смена пришла тот давай сначала разбираться чё за фигня, пришёл значит к выводу что на сервере всё зашибись и это скрипт глючит я ему начинаю втирать что сам он глючит и скрипт работает, он начал копаться глубже в натуре скрипт вроде глючить не должен и докопался до ошибки (кстати скрипт находится здесь можете посмотреть http://www.autolegra.ru/1.php ) что типа файла удалённого такого нет, я говорю как так был же посмотрел в натуре есть файл дальше копаться начал чё то бубнить начал про то что типа возможно какая то фигня у этих на сервере что файл не открывается возможно ли такое, а то мне с ними завтра базарить а я уже даже и незнаю чё говорить. Короче всё свелось к тому что возможно всё таки это у них https в пхп ненастроен и что счас он ничего нескажет потому что незнает что сказать. Сорри за такой конспект чё то поговорить пробрало :)

	автор: cheops (04.05.2005 в 21:54) письмо автору
	для: sata (03.05.2005 в 21:22)
	Бубнящий под нос программист/админ/технарь находка для шпионов и хакеров :))) Такго узнать можно, особенно если подготовленный человек спрашивает. Я бы на месте админа попросил бы входные-выходные данные, скрипт и сказал бы "Разберёмся". Зато может вы не только себе поможете, но и всем хостящимся на их сервере :)

	автор: sata (07.05.2005 в 12:04) письмо автору
	для: cheops (04.05.2005 в 21:54)
	Короче полная засада и за что тока 10 баксов в месяц плочу (правда фирма платит). Нифига у них не настроен https в php так что выдрать никак неполучится, а очень надо. Помозговав немного поспрашивав у умных людей пришлося всё к выводу Что в качастве варианта: организовать тунель. то есть какой-то скрипт на чем-то написанный, которому в качестве параметра передается адрес https сайта, а он возвращает содержимое страницы из своего скрипта обращаешься к тому, а он тебе отдает содержимое. Посоветовали мне https проще открывать из перла.. Во а вот как это реализовать что то я недогоняю, в perle я ваще не шарю. Может будут какие нить идеи или сталкивался уже кто с этим. Спасибо

	автор: sata (07.05.2005 в 23:49) письмо автору
	для: sata (07.05.2005 в 12:04)
	Всё таки выдрал я инфу с их сайта через curl скрипт здесь http://www.autolegra.ru/test.php. Уважаемый cheops я тут сижу в полной "Ж" так как незнаю что делать, а что знаю незнаю как реализовать. Смысл всего таков: вглубь этого https://www.iaai-bid.com/ сайта попасть могут тока зареганые пользователи а их немного так как это закрытый сайт. Вот у меня и стоит задача (над которой я уже фиг знает скока думаю) нужно таблицы с машинами перенести на свой сайт при этом не выдав пароль с логином юзерам. Поразмыслив надумал тока пару вариантов. 1 вариант. Скрипт должен авторизоваться и вытащить инфу с сайта внести её в нашу базу данных а дальше уже делай что хочеш, но проблема с авторизацией и https и при этом ещё фиг знает как фотки от туда выудить к себе. 2 вариант. Возможно страницы сохранять вручную Дабы их немного и тогда вопрос с авторизацией и https отпадает напроч но остаётся вопрос как же занести инфу и фотки в базу. Блин это последнее что нужно зделать на сайте чтобы здать его и я нифига неврубаюсь ка реализовать сиё дело вроде додумаеш идею а блин какая нить фигня заступорит всё делоБуду Благодарен за любые идеи.

	автор: cheops (08.05.2005 в 00:31) письмо автору
	для: sata (07.05.2005 в 23:49)
	Вы можете посмотреть ссылки по теме, а так же темы по ссылкам, а так же ссылку указанные в них - это всё вполне реально, главное получить страницу, разобрать её по винтику не вопрос, если не боитесь регулярных выражений (если боитесь, я вам помогу :). http://www.softtime.ru/forum/read.php?id_forum=1&id_theme=3110 http://www.softtime.ru/forum/read.php?id_forum=1&id_theme=3137 http://www.softtime.ru/forum/read.php?id_forum=1&id_theme=3181

автор: sata (10.05.2005 в 15:07) письмо автору

для: cheops (08.05.2005 в 00:31)

Мда что то с регулярками у меня совсем туго, Но я их небоюсь :)
Приложил файл страницы откуда выдирается
Захороводил я что то типа этого

<?php set_time_limit(0); $page = file_get_contents("http://autolegra.ru/details.htm"); $pattern = "|<SPAN id=stockNumber2>([^])</SPAN>|"; preg_match_all ($pattern,$page,$out,PREG_PATTERN_ORDER); echo "<pre>"; print_r($out[1]); echo "</pre>"; ?>

Но результата недобился. Страница с тех характеристиками машины каждая характеристика имеет свою метку вот сижу копаю как их оттуда изьять. После изьятия уже в базу закинуть как нефиг делать.

автор: sata (10.05.2005 в 17:09) письмо автору

для: sata (10.05.2005 в 15:07)

О блин допёрло :)

<?php set_time_limit(0); $page = file_get_contents("http://autolegra.ru/details.htm"); $pattern = "|<SPAN id=stockNumber2>([0-9]+)</SPAN>|"; preg_match_all ($pattern,$page,$out,PREG_PATTERN_ORDER); echo "<table>"; for($i = 0; $i < count($out[1]); $i++) { echo "<tr><td>".$out[1][$i]."</td></tr>"; } echo "</table>"; ?>

автор: sata (10.05.2005 в 20:44) письмо автору

для: sata (10.05.2005 в 17:09)

Вот сварганил скриптик (неработает) что то я опять с регами намухливал. Непоможите

<? set_time_limit(0); //Открываем страницу $url = "https://www.iaai-bid.com/branchauctions.aspx?branch=623"; $ch = curl_init(); curl_setopt($ch, CURLOPT_SSL_VERIFYPEER, FALSE); curl_setopt($ch, CURLOPT_URL,$url); curl_setopt($ch, CURLOPT_FAILONERROR, 1); curl_setopt($ch, CURLOPT_FOLLOWLOCATION, 1); curl_setopt($ch, CURLOPT_RETURNTRANSFER,1); curl_setopt($ch, CURLOPT_TIMEOUT, 3); $result = curl_exec($ch);//сохраняем содержание в переменную //=================== $page = file_get_contents("$result"); $pattern = "|<A class=stockno href=([-a-z0-9])</A>|"; preg_match_all ($pattern,$page,$out,PREG_PATTERN_ORDER); print_r($out[1]); curl_close($ch); ?>

	автор: cheops (11.05.2005 в 12:15) письмо автору
	для: sata (10.05.2005 в 20:44)
	А какой кусок необходимо извлечь?

	автор: sata (11.05.2005 в 22:32) письмо автору
	для: cheops (11.05.2005 в 12:15)
	А взять нужно все характеристики они все имеют метки я для теста взял тока Stock Number он с меткой class=stockno. Зделал отсев тока по номеру а вот всё в куче нифига неполучается что то. Сварганил уже бета версию скрипта который по идее должон работать но загвоздочка вот собственно в чём по идее открываем страницу и содержимое должно сохраняться в файл потом файл фильтруется регами и выводится результат, в файл ничего не сохраняется но если тестить просто на вывод то страница выдирается и выводится на экран. Чё то я как то запутано обьяснил. Тут в будущем есть одна проблема текст то сохранится в базу, а вот как быть с фотками при выводе все урлы меняются. И вопрос по идее если как то выдрать эти фотки их же можно сохранить в базу как бинарники (в BLOB ) или их аплоэдить придётся. Спасибо

вверх

Форум PHP